よりスマートなデジタル・プリディストーションの実現に向けて、ニューラル・ネットワークを活用する

質問:

ニューラル・ネットワークをベースとするデジタル・プリディストーションのモデルで使用する活性化関数を変更したとします。その場合、システム全体の性能やエネルギー効率にどのような影響が及びますか？

Toward Smarter Digital Predistortion Engines: A Neural Network-Based Approach

回答:

正規化線形ユニット（ReLU：Rectified Linear Unit）のような演算効率の高い活性化関数を使用すれば、エネルギーの消費量を削減できます。つまり、そうした関数はモバイル機器やIoT（Internet of Things）機器のようなリソースが限られた環境に適しています。それに対し、シグモイド関数や双曲線正接（tanh）関数のような複雑な関数を選択すれば、特定のシナリオにおいて優れた性能を得ることができます。但し、それらの関数は演算負荷が大きいので、エネルギーの消費量が増大する可能性があります。つまり、デジタル・プリディストーションのモデルで使用する活性化関数を選択する際には、性能とエネルギー効率の両方を考慮しなければなりません。その上で、対象とするアプリケーションに応じてシステムを最適化する必要があります。

はじめに

2022年11月、OpenAIは「ChatGPT」を発表しました。このソフトウェアは極めて速く普及し、AIの可能性を示す存在になりました。AIを実現する要素である機械学習（ML：Machine Learning）は、意思決定やデータの分析といったタスクの実行に対して極めて有用なものです。実際、MLは各業界に変革をもたらしています。通信分野について言えば、AIとMLはDPDの進化を牽引する技術として活用されています。DPDは、PAが出力する信号の歪みを低減しつつ、電力効率の改善を実現する重要な技術です。ただ、従来のDPDのモデルにはいくつかの課題がありました。例えば、5Gのような最新の通信システムにおいては、非線形性やメモリ効果に対処するのが困難なケースがあるといった具合です。従来のDPDのモデルは、PAの動作が静的であり、メモリ効果は生じないという仮定に基づいています。また、瞬間的な入出力の関係のみを考慮した多項式のモデルに依存しています。それに対し、AIとMLを活用した手法は、複雑なパターンの学習の面で優れています。その手法を採用すれば、より精度の高いソリューションを実現できます。本稿では、優れたDPDを実現するものとして、人工NNをベースとしたフレームワークを紹介します。この手法を用いれば、PAの特性に関するデータを活用してゲイン／位相の誤差を低減しつつ、電力効率を高め、スペクトル性能を向上させることが可能になります。

DPDとAIの融合で、PAの効率を高める

DPDは非常に重要性の高い技術です。これを利用すれば、線形性を損なうことなく飽和領域の付近でPAを効率的に動作させられます。PAが線形に動作する範囲を拡大することができれば、線形性には欠けるものの効率の面では優れるPAを活用することが可能になります。そのような方法により、直交周波数分割多重（OFDM：Orthogonal Frequency Division Multiplex）をはじめとする複雑な変調方式に必要な送信信号の線形性を確保することができます。

一般に、DPDはプリディストータ係数を使用することでその機能を実現します。同係数は、PAが備える反転AM-AM（振幅対振幅）特性とAM-PM（振幅対位相）特性をモデル化することで得られます。DPDのプロセスでは、入力波形に高精度の歪み補正を適用することで、PAの非線形性を効果的に補償します。DPDは、そのようにして信号の質を向上させながら、PAが最高の効率で動作できるようにする役割を担います。DPDのアルゴリズムの詳細については、「5G送受信基地局におけるトランスミッタのラインアップ、設計、評価の簡略化」をご覧ください。この記事では、アナログ・デバイセズのRFトランシーバー「ADRV9040」を、DPDの設計／実装のための合理化されたハードウェア・プラットフォームとして利用する例も紹介しています。図1は、DPDによってPAの応答を線形化する方法について説明したものです。

図1. DPDの概要。PAの応答を線形化するために使用されます。（a）は一般的なAM-AM曲線であり、全体としての応答（線形な領域）を緑色で示しています。（b）は、DPDを使用してPAの応答を改善する方法について説明したものです。

PAは、飽和領域の付近で動作する場合に非線形性を示します。その結果、信号の歪み、スペクトル・リグロース、効率の低下が生じます。特に、I/Qの不均衡やメモリ効果を伴う広帯域幅のシステムでは問題が顕著になります。AIとML（特にNN）を活用すれば、PAの歪みをモデル化し、プリディストーションを動的に最適化する革新的なソリューションを実現できます。このようなアプローチにより、効率と適応性を高められます。それだけでなく、性能と演算の複雑さのバランスをとることが可能になります。結果として、従来の手法を凌駕する性能が得られます。

NNのモデルによりDPDエンジンを最適化、大きな変革をもたらすフレームワーク

人工NNは、AIにおいてディープ・ラーニングを実行する際の基盤になります。従来のMLのアルゴリズムには限界がありましたが、人工NNはそれを克服するように設計されます。人工NNは、人間の脳の情報処理能力から着想を得たものです。パターン認識、学習、意思決定に対して非常に有効に機能します。特に、複雑かつ非線形な問題を扱う場合には最適な選択肢になります。例えば、5GのシステムにNNをベースとするDPDのアプローチを適用したとします。そうすれば、I/Qの不均衡、位相のシフト、DCオフセット、クロストーク、PAの非線形性などの課題に効果的に対処することが可能になります。

多項式をベースとする従来のDPDを活用するためには、システムの仕組みに関する広範な知識が必要です。それだけでなく、スケーラビリティの面でも課題が存在します。それに対し、NNのモデルでは、より少ない制約の下、複雑かつ非線形な動作に対する処理を効果的に実行できます。以下では、非線形性とトランスミッタの障害を軽減することが可能なNNベースのDPD向けフレームワークについて説明します。そのフレームワークによる処理は、3つの主要なステップから成ります。1つ目はPAの特性の評価と多様なデータの収集、2つ目はNNをベースとするポストディストータのモデルのトレーニング、3つ目は性能の監視と調整を伴うモデルの配備です。このアプローチでは、MLを活用することによって大規模なデータ・セットから実用的な洞察（actionable insight）を生成します。それにより、現代の通信システムが抱える課題に対処することが可能な堅牢でスケーラブルなソリューションを実現できます。以下、3つのステップについて順に説明していきます。

【ステップ1】PAの特性を評価してデータを収集する

無線システムのPAを最適化するためのAI/MLのモデルを設計／実装するには、何が必要になるのでしょうか。非常に重要なのは、様々な条件におけるPAの実際の性能を評価することです。つまり、その性能を正確に反映した包括的かつ高品位の特性評価データを収集しなければなりません。

図2. 広帯域に対応するPAの評価環境。あらゆる特性を評価し、その結果となるデータを収集します。

図2に、PAの特性を表すデータを収集するための評価環境の例を示しました。このような環境を使用して、PAのSパラメータ、供給電力、電力付加効率（PAE：Power Added Efficiency）、入力インピーダンス、入力リターン・ロス、電力ゲイン、AM-PM変換といったパラメータの値を抽出します。それにより、PAのあらゆる特性を表すデータを用意するということです。表1に、モデルに入力するデータ・ポイントの包括的なリストを示します。このモデルの次元は、応答時間に影響を与えることに注意してください。また、取得した評価結果は、トレーニングのプロセスで利用するためにデジタル・データに変換しておく必要があります。

表1. 測定の対象領域のリスト
対象領域	説明と詳細
小信号に対する特性の評価	対象とする周波数範囲の全体にわたり、様々なバイアス条件の下、ベクトル・ネットワーク・アナライザによって測定したSパラメータを使用し、小信号に対する特性を評価してデータを収集します。それらのパラメータにより、PAの入出力マッチングと周波数応答に関する知見が得られます。
非線形な動作と大信号に対応するデータ	大信号に対する動作時の非線形な特性の測定データを収集します。入出力電力の関係（P_IN対P_OUT）、PAE、ゲインの圧縮ポイント（P1dBなど）に関する測定も行います。出力レベルが高い場合のPAの動作について理解する上では、特にAM-AM特性とAM-PM特性の歪みデータが有用です。
効率の指標	効率（様々な負荷／入力電力レベル／周波数の条件で測定したドレイン効率や全体効率など）と動作温度のデータを収集します。
線形性と信号の完全性	隣接チャンネル漏洩電力比（ACPR：Adjacent Channel Power Ratio）、エラー・ベクトル振幅（EVM：Error Vector Magnitude）、相互変調歪み（IMD：Intermodulation Distortion）といった線形性に関する指標のデータを収集します。
熱性能	温度センサーを使用して熱性能のデータを収集します。それにより、様々な出力レベル／周囲条件における熱の放散やPAの信頼性に関する知見が得られます。
環境と経年変化に関するデータ	環境条件（温度や湿度の変化など）に関するデータを収集します。また、加速劣化試験は長期的な性能と信頼性の予測に役立ちます。
ノイズに関する特性	ノイズに関する性能は、ノイズ指数や位相ノイズ・スペクトルといった指標を用いて評価します。それにより、信号の完全性に関する重要な情報が得られます。

データの収集に当たっては、厳密かつ体系的なアプローチを採用する必要があります。そのことが、PAの性能の正確な予測／最適化を実現可能なAI/MLのモデルを開発するための基盤になります。そのようにして得られた包括的なデータ・セットを活用することで、信頼性と効率に優れる無線通信システムを実現することが可能になります。

【ステップ2】モデルのトレーニング

次に、モデルのトレーニングのプロセスについて説明します。このステップでは、表1に即して収集した信号（一部またはすべて）を本稿で紹介するシステムに入力します。その上で損失関数を使用し、誤差を最小限に抑えられるようDPDのモデルを最適化します。NNのアーキテクチャは、相互に接続されたノードの層（人工ニューロンなど）によって構成されます。具体的には、図3に示すようなコア・コンポーネントとして編成されます。表2は、このコンポーネントの構成要素についてまとめたものです。

表2. NN（Neural Network：ニューラル・ネットワーク）のコア・コンポーネント
コア・コンポーネント	説明と詳細
入力層	入力のI/Q成分は、I_IN(n)とQ_IN(n)と表記されます。これらは、モデルの最小要件を形成します。P_IN/P_OUTやAM-AM/AM-PMのデータといった追加の独立変数については表1にまとめてあります。NNのDPDのモデルは、表1に示したすべての入力変数を使用してトレーニングすることができます。但し、多数の従属変数を取り込むと、モデルの次元と計算量が増大します。そのようにして複雑さが増すと、対象とすべき重みとバイアスも増えて、トレーニングと推論にかかる時間が長くなります。それだけでなく、モデルを保存して中間的な演算を実行するために必要なメモリの量も増加します。
隠れ層	隠れ層は入力層と出力層の間に配置されます。各ニューロンは、前方の層から入力を受け取り、加重和を適用し、バイアス項を加算します。得られた結果は活性化関数を介して引き渡します。様々な活性化関数を試し、環境と結果に基づいて最適なものを選択するとよいでしょう。
出力層	出力層はネットワークによる予測結果を提供する層であり、最後尾に配置されます。この層は、隠れ層で学習した高レベルの特徴を意味のある予測に変換する役割を果たします。図3の出力層は、2つのノードから成るマルチクラスのシナリオを表しています。2つのノードは、線形活性化関数を備える2つのニューロンで構成されています。それらの出力は、DPD用のアクチュエータ・ブロックで使用する重みと係数にマッピングされます（図4）。また、それらの出力は直接解釈されることもありますし、更に処理が施されることもあります。
重み	重みは、隣接する層に存在する2つのニューロン間の接続の強さまたは重要性を表します。つまり、重みはある層のニューロンの出力が次の層のニューロンの入力にどの程度の影響を与えるのかを決定します。
バイアス	バイアスは、ニューロンへの入力の加重和に加算される追加のパラメータです。これにより活性化関数が変化するので、ネットワークにおいてより複雑な関係をモデル化できるようになります。
活性化関数	活性化関数は、モデルに非線形性を導入し、データの複雑なパターンや関係を学習／表現できるようにするものです。代表的な活性化関数としては、ReLU関数、シグモイド関数、tanh関数、ソフトマックス関数などが挙げられます。

トレーニングの実行中、隠れ層はデータを前方に伝播させます。そして、勾配降下法を使用したバックプロパゲーション（誤差逆伝播法）によって重みとバイアスを最適化します。ネットワークの構造については、非線形性の強い要素に対してより多くのニューロンを割り当てるように調整することができます。一方、より線形性の高い要素に対してはより少ないニューロンを割り当てることが可能です。

AIのモデルのトレーニング環境を効果的かつスケーラブルなものにするには、最適なハードウェア、ソフトウェア、ツールを選択する必要があります。本稿ではそれらの詳細については触れませんが、AIを担当する技術者には「KNIME」の利用を検討することをお勧めします。KNIMEは、データの分析とMLを実行するためのプラットフォームです。そのGUI（Graphical User Interface）を使用すれば、コードを記述することなく、ノードをドラッグ＆ドロップするだけでワークフローを設計できます。つまり、コーディングに関する深い知識は必要ありません。設計済みのワークフローは、非常に視覚的で理解しやすいものになります。そのため、KNIMEは多様なユーザ層に受け入れられるはずです。またPythonを利用したいユーザの場合、「Keras」と「TensorFlow^®」を利用することで大きなメリットを享受できるでしょう。これらを組み合わせれば、KerasのシンプルさとTensorFlowの堅牢性／スケーラビリティが融合されることになります。実験のレベルから実用のレベルまで、ディープ・ラーニングのアプリケーションを扱う様々なプロジェクトにとって、この組み合わせは最適な選択肢になり得ます。

PAの特性を評価する際には、非常に多くのデータを収集することになります。それらのうち70%をトレーニングに使用し、残る30%はテストと検証に用います。テストと検証では、構築したモデルがPAの動作をどれだけ正確に模擬できているのかを確認します。モデルの性能は、正解率、適合率、再現率、F1スコア、ROC-AUCなどの指標によって評価します。

【ステップ3】NNのモデルの検証と配備

NNのモデルを配備するプロセスは、堅牢性と精度を確認するためにモデルを検証することから始まります。その際には検証用のデータを使用し、トレーニングを実施している際のクオリティと終了の条件を監視します。また、テスト用のデータを使用して精度と汎化性能を独立した形で評価します。重要なのは、新たなデータに対してモデルが適切に汎化するよう過学習（過適合）と過小学習（過小適合）に対処することです。過学習を緩和するには、層、隠れニューロン、パラメータの数を制限してモデルを簡素化します。あるいは、トレーニング用のデータ・セットを増やしたり、プルーニングしたり（性能にそれほど寄与しない冗長なニューロンを削除するなど）することで、汎化性能を高めます。そのようにすることで過学習を緩和することができます。隠れニューロンにおいてモデルの複雑さを高めるには、学習率／バッチ・サイズ／正則化強度などのハイパーパラメータを調整して性能を向上させます。そうした戦略のバランスを取りつつDPDのモデルの性能を繰り返し評価し、モデルの実行速度に注意を払いながら堅牢性が高く汎化が可能なモデルを実現しなければなりません。図4に、NNを利用するDPDのモデルを評価するためのシステムの例を示しました。

隠れニューロンの最適な数を決めるには、実証的な研究、トライ＆エラー、あるいはトレーニング中の適応的な手法が必要になります。そうした形で調整を実施することにより、NNの複雑さと性能のバランスをとることができます。そうすれば、効率的かつ効果的なモデルの配備が可能になります。モデルの配備は、アナログ・デバイセズの「MAX78000」のような製品を採用することで容易化できます。同ICはエッジにAIを導入するためのマイクロコントローラであり、畳み込みNNに対応するアクセラレータを備えています。

AI/MLとDPDシステムの統合 - 課題と機会

AIとMLをDPDシステムに統合すれば、大きな改善の可能性が生まれます。但し、その際には実用上の課題も浮上するはずです。DPDシステムには、高速に処理を実行することとレイテンシを抑えることが求められます。そのため、演算負荷の高いMLのモデルを使用すると、実用的なDPDが得られなくなる可能性があります。また、温度の変動やハードウェアの経時変化といった動作条件は動的なものです。そうした条件に対応して最適な性能を維持するためには、リアルタイムの学習や転移学習といった適応型の手法が必要になります。

エネルギー効率は、もう1つの重要な課題です。AI/MLのモデル（特にディープ・ラーニングのアーキテクチャ）は、従来のDPDの実現手段と比べて多くの電力を消費するケースが少なくありません。つまり、エネルギーの消費量が重視される環境にはあまり適していないと言えます。今後行われるであろう実験には、標準的なNNを最適化した軽量NNを使用すべきです。軽量NNは、パラメータの数と必要な演算量を抑えられるように設計されており、メモリ効率に優れています。モバイル機器やIoT機器のようなリソースが限られたシステムや演算用のリソースが限られたアプリケーションでは特に有効に機能します。

ML（特にディープNN）のモデルの多くは解釈可能性に欠けており、DPDシステムに統合する作業がより複雑になります。それらのモデルでは、重み／バイアス／活性化関数に関する複雑な演算が削減されます。そのため、意思決定のプロセスが不透明である場合にはデバッグと最適化が困難になります。

まとめ

大規模MIMO（Massive Multiple Input Multiple Output）のような5Gの技術では、消費電力の削減と精度の向上が求められます。そのため、DPDシステムも、新たな複雑さに対応できるよう進化させなければなりません。AI/MLは、適応学習やハイブリッド・モデリングといったイノベーションを通じ、スケーラビリティとエネルギー効率の高いソリューションを実現する上で重要な役割を果たすはずです。NNを利用すれば、複雑な非線形性とメモリ効果をモデル化することができます。数学的な定式化を明示的に行うことなく非線形関数を近似できるので、DPDシステムの設計を簡素化することが可能になります。

AI/MLとDPDシステムの統合を図れば電力効率が向上します。また、非線形なPAを使用することでコストを低減しつつ、そのPAを飽和領域の近くで動作させることができます。課題は存在するものの、AI/MLを活用するDPDシステムは、精度、適応性、スケーラビリティの向上に向けた大きな可能性を秘めていることは間違いありません。また、多項式をベースとする従来の手法とAI/MLを利用する手法を組み合わせたハイブリッド型のアプローチも考えられます。その手法を採用すれば、従来のモデルの解釈可能性とAI/MLの高度な機能を融合することでバランスのとれたソリューションを実現することができます。革新的な戦略によって課題に対処すれば、AI/MLはDPDシステムに極めて大きな進化をもたらします。通信技術の発展は、そうした新たなDPDシステムによって支えられることになるでしょう。

著者

Hamed M. Sanogo

Hamed M. Sanogoは、アナログ・デバイセズのプリンシパル・エンジニアです。カスタマ・ソリューションズ・グループ（CSG）に所属。専門は航空宇宙、防衛、通信、データ・センターです。20年近くにわたり、FAEやFAEマネージャ、セキュアRFID／認証用ICを担当するプロダクト・ライン・マネージャなど、様々な職務に携わってきました。現在はエンド・マーケット・スペシャリストとして、重要性の高い分野向けの最先端のソリューションを担当しています。イノベーションの実現と課題の解決に対する情熱を持って業界の発展に貢献してきました。以前は、General Motorsのシニア設計エンジニアとして業務に従事。Motorola Solutionsでは、シニア・スタッフ・エレクトリカル・エンジニアとしてNode-B／RRUベースバンド・カードの設計を担当していました。ミシガン大学ディアボーン校で電気工学の修士号、ダラス大学で経営学の修士号を取得。強固な基盤の上に築いた専門知識を有しています。