ICのトラブルシューティングと不具合解析:事実の調査と推測の排除

2012年12月13日
myAnalogに追加

myAnalog のリソース セクション、既存のプロジェクト、または新しいプロジェクトに記事を追加します。

新規プロジェクトを作成

要約

複雑なデバイスのトラブルシューティングでは、情報が最も重要です。ICの正確なリビジョン番号、関連する参考資料がどこにあるか、お客様の施設で発生した事態の詳細を知っているのは誰かなどを含めて、問題に関連するすべてを知ることが望まれ、知る必要があります。もちろんお客様を手助けすることが我々の主な仕事であるため、ICの不具合解析には迅速で適切な対応が要求されます。しかし、品質保証(QA)部門は不具合解析(FA)時にすべての条件にわたって各パラメータをテストするのでしょうか?そうではありません。その大部分は推測で行われます。驚く人がいるかも知れませんが、QA部門の担当者は水晶玉を持っているわけでも、人の心を読むことができるわけでもありません。迅速で効果的なICのトラブルシューティングは、お客様からICの不具合に関する正確な技術的情報を入手することができる場合にのみ可能なのです。

同様の記事が2012年10月31日に「EDN」に掲載されました。

ICの不具合解析—時間を無駄にする可能性

「認識されたことが現実である(perception is reality)」という言葉を良く耳にします。ICが故障した場合、あるいは故障したとお客様が思い込んでいる場合、その対応として不具合解析(FA)を行う必要があります。FAを効果的に行うためには、事態に関する正確かつ適切な情報が必要です。それが推測を防ぐ唯一の方法です。

少し前にあった事例で説明しましょう。あるデバイスが故障品として返却され、それ以外には情報がありませんでした。我々はそのデバイスを自動試験装置(ATE)にかけ、ベンチテストを行い、X線写真を撮り、パッケージを開封しました。電子顕微鏡でソフトエレクトロンを注入し、損傷を示す放出点を探しました。液晶コーティングを使用して温度を測定しました。そのデバイスは完全な状態でした。不具合の理由を発見することができず、QA部門はその結果をそのとおりにFA報告書に記載しました。なぜそのデバイスが不具合品として返却されたのか、不思議でした。

2ヶ月ほど後で、ほとんど偶然から、我々はそのデバイスが+60℃以上に過熱された場合にのみ不具合が発生していたことを知りました。我々は再度FAを開始しました。我々はそのデバイスを室温(+25℃)でテストしたため、何も分からなかったのです。そのデバイスはテストの過程で破壊されており、もう動作しませんでした。結局、これは1回返却されただけで、2度と発生しませんでした。しかし、このエピソードはそれよりも重要なことを教えてくれます。重要なパフォーマンス(すなわち、不具合)データがない限り、我々は盲目であり、推測するしかないということです。我々はかなりの時間と資金を費やし、すべて無駄になったのです(クラシックカー、グランドの問題、および別のICの故障についてのより個人的な体験談は、「付録—業務外のIC不具合解析」を参照)。

消耗するばかりの無駄なQA

多くの場合、故障したICの損傷が激しいために、損傷の原因を判断することができません。あるお客様は、契約組立て工場から基板を自社の研究施設に送り返しました。そこで基板からICが取り外され、ICの故障ということになりました。おそらくそうでしょう。お客様は、「根本原因」はIC自体にあるという結論に到たりました。彼らはFAを要求しましたが、不具合データはどこにあるでしょうか?状況は注意深く記録されていたでしょうか?どうすれば不具合の再発を防止できるのでしょう?我々は事実の調査ではなく、また推測に戻ることになりました。これは意味のあるFAの手順とはとても言えません。

この事例では、お客様は多出力デバイスの3つの端子のみに注目していました。我々に分かっていたのは、そのデバイスが出荷時に動作不良である確率は数十億個に数個であること、回路内で数時間にわたって動作したあと故障したことでした。初期不良だったのでしょうか、それとも外部的な取り扱いによって損傷したのでしょうか?お客様の回路に原因があったのでしょうか?アプリケーション環境が原因でしょうか?出荷前に静電気放電(ESD)で回路が劣化したために、あとから故障したのでしょうか?もしかすると、出荷担当者がESD手順を無視したために損傷したのでしょうか?考えられる要因のリストには際限がないと思われました。

最初にお客様から受け取った部分的な回路図は、あまり役に立ちませんでした。故障したデバイスが何によって駆動されるのかも、デバイスが何を駆動するのかも示されていませんでした。現地のFAEにグランドの調査が依頼されました。グランドは適切に分離されていたのか?回路図からは判断することができなかったのです。他にも数枚の回路図を受け取りましたが、答えよりも疑問の方が増えました。なぜお客様は多数の出力の中で3つの端子のみを調べたのでしょう?デバイスの入力または出力端子の中に、ローインピーダンスで基板の端子に接続されていたものがあるのでしょうか?電源とグランドはローインピーダンス接続に含まれていたのでしょうか?基板の端子のESDが問題だったのでしょうか?我々は依然として推測を続けている状態でした。

効果的な不具合解析—犯行現場のトラブルシューティング

ここで問題になるのは、「最初から適切な情報があったら、結果はどうだったか?」ということです。特に不具合について何も具体的なことが分かっていなかったこの事例の場合、すべての条件にわたる各パラメータの網羅的なテストをQAに期待するのは妥当でしょうか?いいえ。我々にできることは、ICが故障した理由をお客様が理解する手助けのみであり、アプリケーションについての適切な知識がなければ問題の修正は不可能です。

明らかにこのアプローチは、FAは遅滞なく実施されるべきだと信じている人々と衝突します。「FAはどんな場合でも最初に行うべきことであり、アプリケーション回路内でのICに着目する前にIC内の各部分を調べるべきだ」というのを聞いたことがあります。その考えがどこから来るのか理解できませんし、その考えに同意することもできません。FAは最初に行うべき作業ではありません。むしろ、「犯行現場」、すなわち不具合インシデントの調査こそ最初のステップです。

不具合が発生した場所での情報は非常に重要であり、警察の捜査官と同様、我々は徹底して現場のデータを保全すべきです。最初に行うべきことは、アプリケーション回路内、すなわち故障した場所でICを調べることです。はんだ飛びなどの単純なことが正解への鍵かも知れません。ICが完全に故障するのではなく部分的には動作する場合もあります。実際、ICを取り外すと真の問題が隠されてしまう可能性があるのです。

効果的なFAのためには、我々はお客様の回路図を調べ、不具合が発生するすべての状況、理由を集める必要があります。確かに、この作業はお客様の機密の問題に直面します。これは共通の問題であり、そのために秘密保持契約(NDA)が存在します。これはまた、全世界でFAEが我々の目と耳の役割を果たす状況でもあります。FAEはお客様の施設に出向き、回路図、レイアウト、およびアプリケーションに関するその他の状況を評価することができます。お客様の機密を保護するために、FAEはお客様の設計図の中で関係する部分のみをQAに送付する必要があります。そしてようやく、信頼すべき不具合データに基づいてQAが作業を開始することになります。

成果ある結果

元の話に戻りましょう。この不具合の件で、現地のFAEはそのお客様とより緊密に関わるようになりました。より多くの回路図を入手した結果、僅かですが以下の事実が判明しました。出力端子にはオペアンプが接続されていますが、それは10kΩの直列抵抗があるため影響はほとんどないはずです。各グランドを1つのスターポイントで個別に接続するのではなく、1つの共通のグランドを使用することにより、1つの電源のノイズがデカップリングコンデンサを介して他の電源に直接混入します。最小のデカップリングコンデンサは0.1µFです。標準的な表面実装の0.1µFのコンデンサは自己共振周波数が約15MHzで、その周波数を超えるとインダクタとなってコンデンサの機能を果たさなくなります。

ここから2つの教訓が得られます。第1に、デカップリングコンデンサは双方通行です。ノイズの多い電源とノイズの少ない電源を結合した場合、ノイズの少ない電源がノイズによって汚染されます。第2に、ノイズの多いグランドでも同じことが起こり、ノイズの少ない電源がノイズによって汚染されます。ノイズの多い電源はノイズの多いグランドと組み合わせ、クリーンでノイズの少ない電源はクリーンな電源と組み合わせる必要があります。相互汚染によって、電源とグランドの両方が損傷する可能性があります。コンデンサは自己共振周波数より上では誘導性になるため、高周波数エネルギーの伝導や減衰は行われません。

結論

これで話は一巡し、ICの不具合のトラブルシューティングでは情報が最重要であるという、冒頭のコメントを繰り返すことになります。調査の最初から、お客様と一緒に問題を調べる現地のFAEより貴重なものはありません。FAEはシステム全体、基板レイアウト、回路図、およびアプリケーションを精査したあと、そのデータをQAに伝える必要があります。正確で、詳細なデータが存在する場合にのみ、我々はICの不具合の問題を解決することができます。そのデータがないと、QAは「犯行現場」について推測する以外ありません。

付録—業務外のIC不具合解析

これに関連して、故障した電子回路を解析する際に情報が最も重要であることを示す話を紹介します。すべての完全な不具合データがない限り、正確なFAを導き出すことは不可能です。この話は、最初はICのトラブルシューティングの問題ではありませんが、すぐにその問題へと発展します。

友人のひとりが、1927年~1931年の間に生産されたクラシックカーのFord®モデルAを所有しています。彼は地元のカー用品店で購入したラジオを取り付けました。取り付けた時点で、ラジオは動作しませんでした。彼はそれを店に持って行き、交換してもらいました。新しいラジオを取り付けてみると、また動作しません。「不良」のラジオが3回続いたあとで、店は代金を返金しました。

彼は、クラシックカークラブの仲間にこの話をしました。すると彼らは、モデルAが正のグランドを使用しているため、ラジオの電源リードが逆だったのだと教えてくれました。ラジオは正の電圧に接続しなければならないのに、実際には負の電圧に接続されていたのです。電源を逆に接続すると、半導体から煙が出ることになります。

モデルAの物語はまだ続きます。正のグランドという知識を得て、電源電圧を反転させるために、友人は高価な特注品のDC-DCコンバータを購入しました。テストのために、彼は作業台の上でバッテリをDC-DCコンバータとラジオに接続しました。うまく動作しました。次に彼は、すべてを自動車に装着しましたが、ヒューズが飛びました。ついに彼は、エンジニアである友人の私に助けを求めたのでした。

モデルAのシャーシは、バッテリの正の端子に接続されています(現代の電子回路では、負の電源に相当します)。1956年以降の米国製自動車は負のグランドを採用しており、バッテリの負の端子がシャーシに接続されているため、正の電源となっています。現在カー用品店で販売されている民生用機器は、自動車が負のグランドを使用していることを想定しています。下の図1が作業台で動作したのは、ラジオが自動車のシャーシにボルト止めされていなかったためです。

図1. この構成が作業台で動作したのは、点線で示すシャーシグランドがラジオに接続されていなかったためです。

図1. この構成が作業台で動作したのは、点線で示すシャーシグランドがラジオに接続されていなかったためです。

コスト削減のために、DC-DCコンバータの内部にはグランドの絶縁が存在しません。実際、正の入力と正の出力はシャーシグランドに接続されています。作業台の上では、点線で示すシャーシグランドがラジオに接続されていなかったため、この構成で動作したのです。ラジオが自動車に装着された時点で、ラジオのシャーシが電源に短絡され、ヒューズが飛んだわけです。

あなたがラジオのメーカーの技術者で、返却されてきたこれらのラジオのFAを行うことになったとします。現地のカー用品店は、自分たちが知っている「装着時にラジオが動作しない」ということのみを伝えてきます。ラジオを開けてみると、多数の部品が焼損していることが分かります。何が問題を引き起こしたのでしょう?より詳細なパフォーマンスデータがない限り、推測するしかありません。すでに述べたように、すべてのQA技術者にとって、有効な是正処置を推奨するためには、不具合のすべての経緯が必要なのです。



最新メディア 20

Subtitle
さらに詳しく
myAnalogに追加

myAnalog のリソース セクション、既存のプロジェクト、または新しいプロジェクトに記事を追加します。

新規プロジェクトを作成