banner

ブログ

Jul 19, 2023

教師なしの現実

Scientific Reports volume 12、記事番号: 20783 (2022) この記事を引用

2447 アクセス

1 引用

96 オルトメトリック

メトリクスの詳細

ニューラルネットワークを介して測定された電子飛行時間データに対する現実世界のデータ処理を紹介します。 具体的には、ハンブルクの自由電子レーザー FLASH でのオンライン波長モニタリング用の診断機器からのデータに対する解繊変分オートエンコーダーの使用です。 アプリオリな知識がなければ、ネットワークは信号対雑音比の低いシングルショット FEL スペクトルの表現を見つけることができます。 これにより、人間が直接解釈できる方法で、光子の特性に関する重要な情報が明らかになります。 中心光子のエネルギーと強度、さらに検出器固有の特徴が特定されます。 ネットワークは、アーティファクトの除去だけでなく、データのクリーニング、つまりノイズ除去も行うことができます。 これにより、再構成において、生データではほとんど認識できない非常に低い強度のシグネチャの識別が可能になります。 この特定のケースでは、ネットワークによって FLASH での診断分析の品質が向上します。 ただし、この教師なし手法は、他の同様の種類の分光データの分析を改善する可能性もあります。

自由電子レーザー (FEL) は、フェムト秒からアト秒の時間スケールで非常に強力な光子パルスを生成することにより、フェムト秒からアト秒の領域での原子および分子科学を可能にします。 しかし、FLASH3 などの自己増幅自然放出 (SASE) 1,2 の原理に基づく FEL は、パルスごとに大きく変動する空間的、スペクトル的、時間的なパルス特性を生成します。 したがって、このような施設で行われる科学ユーザー実験のサウンドデータ分析には、シングルショットベースの信頼できる光子診断が不可欠です。 強度や波長などのさまざまな特性に関して記録されたデータを実験後に分類すると、データセット内で不明瞭になったり、さらには隠蔽されたりした物理プロセスの痕跡を明らかにすることができます。 FEL では、絶対パルスエネルギーを測定するためのガスモニター検出器 (GMD)4,5、光子パルス時間構造を決定するための THz ストリーキング 6,78 など、ガスターゲットの光イオン化を測定するために多数の診断機器が使用されています。また、オンライン光イオン化分光計 OPIS9,10 (図 1 を参照) や、光電子分光法を使用して FEL 放射のスペクトル分布に関する情報を取得するいわゆるクッキーボックス 8,11 も含まれます。 これらの診断方法には、ほぼ完全に非侵襲的になるように設計できるという利点があります。 光イオン化プロセスでは、FEL 強度が高いため、機器の相互作用領域のイオン化ガスターゲット内にかなりの空間電荷 10 が生成される可能性があります。 この空間電荷は、FEL パルス繰り返し率が高くても蓄積されます。これは、生成されたターゲットガスイオンがクーロン反発によって十分に早く散逸したり、次の FEL パルスが到着する前に新鮮な非イオン化原子で補充されなかったりするためです。 OPIS などの光電子分光法に基づく機器の場合、空間電荷によって光電子の運動エネルギー分布が変化するため、診断測定が歪む可能性があります。 このような空間電荷による悪影響を最小限に抑えるために、OPIS は低い目標ガス圧力で動作します。 このため、OPIS のシングルショット スペクトルは通常低い計数率を示し、その結果、フォトラインには少数の単一電子イベントのみが含まれ、スペクトル内のスパイクとして現れ、ランダム ノイズ スパイクと明確に区​​別できません (図 1 を参照) )。 意味のある波長結果を得るために、通常は、可変の時間間隔にわたる移動平均スキームが適用されます。 そのため、これまでは実験にとって重要な信頼性の高いショット間の情報を提供することができなかったケースがほとんどでした。 ここでは、診断デバイスによって取得されたデータを圧縮されたわかりやすい形式で表現する特別なタイプのオートエンコーダを利用する人工知能を利用することにより、統計量が低いにもかかわらず、シングルショット分解モードで光子の特性を明らかにする方法を紹介します。方法。

主成分分析 (PCA) などの従来の分析手法は堅牢であり、さまざまなアプリケーションでその能力が証明されています 10 が、次の 2 つの主な問題によって制限される可能性があります。 (a) この手法は線形であるため、本質的に非線形効果を説明することができません。(b)データの表現 (主成分とそのスケーリング係数) は、必ずしも解釈が簡単ではありません。 高次元で適切にスケーリングでき、非線形効果を記述することができるニューラル ネットワークは、科学のあらゆるカテゴリーにおける強力な分析ツールとして、ここ数十年で普及しました12。 ニューロンの層によって構築されたオートエンコーダー (AE) ネットワーク 13 は、データをより低い次元、いわゆる潜在空間に圧縮することができます。 1 層 AE ネットワークは PCA 分析 12 に相当しますが、より複雑で非線形効果のある問題は、エンコーダとデコーダに複数のニューロン層を追加することで処理できます。 このようなネットワークを使用する場合、潜在空間表現は通常、知識の抽出に簡単に使用できず、人間が解釈できるパラメーターに変換するためにさらに処理する必要があります。 これは、たとえば別のニューラル ネットワークを使用して実行できます。 ただし、このプロセスでは、ネットワークをトレーニングするためのラベルの設定、つまり、測定時の特定の物理的特性の実際の値を記録されたデータに帰属させる必要がありますが、このケースや他の多くのアプリケーションでは利用できません。 変分オートエンコーダ 14、15 ネットワーク (VAE) は、ネットワークの次元ボトルネック内の平均および標準偏差ベクトルに対してサンプリング操作を実行します。 損失関数の追加項を使用して、これら 2 つのベクトルを強制的に正規分布に近づけることにより、特定の値の範囲と変動を持つ表現を作成します。 これらの制限内で潜在空間を変更することにより、ネットワークのデコーダ部分を使用して、考えられる測定結果を表す人工データ サンプルを作成することが可能になります。 このアイデアは、損失関数のもつれ解除項が \(\beta\) と呼ばれる係数によってスケーリングされる、いわゆる \(\beta\)-VAE ネットワーク 16 によって実装されました。 したがって、完全な再構成 (つまり、生のデータと再構成されたデータの平均二乗誤差の偏差) と潜在空間ベクトル成分の完全なもつれの解除との間の重みのバランスをとることが可能であり、もつれの解除 (\(L_{ \text {dis}}\)) と再構成品質 (\(L_{\text {rec}}\))、両方とも全体の損失関数 (\(L_{\text {all}}\)) で表されます。

一般に、 \(\beta\) の最適な絶対値を見つけるのは困難です16,17。 \(\beta\) はデータ、つまりノイズ レベル、関心領域のサイズと形状、再構成の品質を評価するために使用される尺度に大きく依存します。

FLASH3 はいわゆるバースト モード パターンで動作し、10 Hz のバースト繰り返しレートでバントレインを生成します。 各バンチ トレインは、最大 1 MHz のバンチ繰り返しレートに応じて、最大数百の単一光子パルスで構成されます。 FLASH218 では、パルスエネルギーとパルス持続時間の範囲はそれぞれ 1 ~ 1000 µJ と 10 ~ 200 fs で、4 ~ 90 nm の波長範囲をカバーします。 OPIS を使用したオンライン FEL 波長モニタリングの場合 (図 1 を参照、詳細については 9 を参照)、本研究では希ガス ターゲット (ガス圧力 \(4.4 \times 10^{-7}\) mbar) を相互作用チャンバーに導入しました。 FLASHパルスによってイオン化されます。 生成された光電子の運動エネルギー \(E_{kin}\) は、独立して動作する 4 つの電子飛行時間分光計 (eTOF) によって測定されます。 励起軌道の結合エネルギー \(E_{bin}\) の知識があれば、私たちの研究のネオン 2p および 2s では、次のようにして光子エネルギー \(E_{pho}\) を計算できます。

eTOF では、光電子は長さ 309 mm のドリフト チューブに沿って移動し、マイクロチャネル プレート (MCP) 検出器によって検出されます。 光電子を減速して eTOF 分光計のエネルギー分解能を高めるために、ドリフト チューブに遅延電圧を印加することができます。

4 つの OPIS 電子分光計 (eTOF 0 ~ 3) によって取得された 11 個の代表的なシングルショット飛行時間スペクトル (サンプル): 下部の灰色のトレースは光電子シグナルを示しませんが、上の他の 10 個のトレースには Ne 2p 光電子が含まれています連続的に飛行時間が長くなっている線は、FEL 光子エネルギーの減少を示しています。 生データは色付きの太字のプロットで示され、対応するサンプルの再構成は黒い細線で示されています。 見やすくするために、ベースラインは垂直オフセット 0.1 で区切られています。 上の 4 つのパネルは、ニューラル ネットワークの入力である完全な電子飛行時間スペクトルを示し、2p ラインが予想される対応する関心領域の拡大図が下の 4 つのパネルに表示されます。 。 ズームイン軸は光電子の運動エネルギーに変換されます。 トレースの主な特徴には、ピーク位置、ランダムヒット、ベースラインの乱れ、ジグザグ構造、プロンプト、2s および 2p ライン、ケーブル接続のインピーダンス不整合による電子反射、および対応する検出器の応答関数などのラベルが付けられます。 これらは (ランダム ヒットとは別に) 再構築され、潜在空間でエンコードされます。 拡大された挿入図は、実物大では見るのが難しい特徴を表しています。 すべてのスケールは線形です。

MCP 検出器からの増幅信号の時間トレースは、7 GS/s のサンプリング レートと 8 ビットの垂直解像度を備えた高速アナログ デジタル コンバーター (ADC) によって記録されます。 各シングルショット スペクトルは 3500 の ADC チャネルで構成され、4 つの eTOF スペクトルの合計は \(4 \times 3.5\,\text {k = 14 k}\) の次元を持つ 1 つのトレーニング データ サンプルを表します (推定値のみを含む)電子の数は 0 ~ 20)。 いくつかの例を図 1 に示します。記録された TOF スペクトルの光電子線の強度は 4 つの eTOF すべてで同等であり、平均して振幅 (標準偏差) の 15 % 以内にあります。 ただし、シングルショット スペクトルでは、統計効果により、フォトライン強度は 4 つの eTOF 間で大きく異なります。 図 1 は、ネオン 2p 電子のさまざまな飛行時間に対する、FEL 放射の光子エネルギーのさまざまな値に対応する一連の正規化されたシングルショット データを示しています。 OPIS 動作パラメータ (ガスターゲット、チャンバー圧力、分光計のリターデーション) が変化しない継続的な波長モニタリングの時間枠が選択されます。 この時間間隔では、FEL 光子エネルギーが 214 ~ 226 eV の間で所定の不規則パターンでスキャンされました。 OPISでは、ネオンをターゲットガスとして使用し、リターディング電圧を170Vに設定した結果、検出される2p光電子と2s光電子の最終的な運動エネルギーはそれぞれ22.4~34.4eVと0.0~7.5eVに減少しました。 約 4,000 万のサンプルが記録されました。

最終的な目標は、低次元の潜在空間ですべての必要な情報を配信するネットワークをトレーニングすることです。つまり、各潜在空間コンポーネントは、人間の心によって解釈でき、したがって情報として直接使用できる、基礎となる核原理の特性を表す必要があります。実験用に。 損失関数の場合、再構成品質の基準として平均二乗誤差 (MSE) が使用されます。 もつれの解除は、正規分布と比較した平均および標準偏差ベクトルのカルバック・ライブラー (KL) 発散 20 によって説明されます。 [0,1] の値の範囲内に自動的に収まるように、出力層はシグモイド関数でアクティブ化されます。 ニューラル ネットワークのハイパーパラメータを最適化するために、約 700 の異なるネットワークがトレーニングされました。 最高のパフォーマンスは、それぞれ 5 層と 4 層で構成されるデコーダとエンコーダを備えた、完全に接続され、ミッシュアクティブ化された 22 層で達成されました。 バッチ サイズ 252 を Adam オプティマイザー 23 と組み合わせて使用​​し、学習率を 25,000 エポック全体で \(10^{-5}\) から \(10^{-7}\) の範囲で減少させるように計画しました。 \(\beta\) の最適化された値は 0.034 です。 合計で記録された 4,000 万のデータ サンプルのうち、3,300 万がトレーニングに使用され、100 万が検証に使用され、残りの 600 万はトレーニング プロセスの外で使用されたテスト データを表します。 エンコーダーとデコーダーの最高のパフォーマンスは、各レイヤーの次元が同じ係数で削減されるようにレイヤーが選択されたときに達成されます。これは、5 つのレイヤーと z と呼ばれる 12 次元の潜在空間の場合、レイヤーの次元を意味します。は

24 から 12 までのステップはサンプリング動作です。 デコーダは、サンプリング動作を除いたエンコーダのミラーリングされたバージョンです。 12 という数字は、1 次元の z のみからネットワークをトレーニングし、次元のボトルネックのサイズを連続的に増加させることによって導出されました。 サイズが 12 より大きい場合、最終的な損失値は大幅に改善されませんでした。 \(z=\left\{ z_{0},z_{1},z_{2},...,z_{11}\right\}\) という表記を使用して、個々のコンポーネント \(z_ {i}\) の潜在空間。

OPIS 測定の目的は、特定の物理量の値を明らかにすることです。 ネットワークがそれらの量を表す潜在空間を見つけたかどうかを分析するために、生データに対して実行される従来の分析によってラベルが作成されます。 信頼できるラベルを提供するには、データが特定の基準を満たす必要がありますが、これは利用可能なデータのごく一部にのみ適用されます。 たとえば、光電子の飛行時間、つまり TOF スケール上の光線の位置 (ラベル \(T_{0,1,2,3}\) で参照) については、従来の最小二乗線プロファイル フィットが適用されます。 4 つの eTOF それぞれの最も強いピークの分析が実行されました。 ここで、ノイズやランダムな電子衝突から有効な光電子線の特徴を区別するための基準は、(a) ピーク振幅が最小強度のしきい値 (図 1 のスケールで 0.5) より大きくなければならない、および ( b) ピークの中心位置は小さな TOF 範囲 (15 TOF チャネル) 内になければなりません。 このフィルターを適用すると、テスト データのサイズが大幅に削減されますが、高品質のデータが返されます。 データの約 3 % がこの基準を満たしており、ラベルと潜在スペースの比較に寄与できます。 \(I_{0,1,2,3}\) と呼ばれる各 eTOF の個々の強度のラベルが、ピーク フィット手順のプロセスでさらに作成されます。 伝播軸に垂直な面内の FEL のビーム位置も変動します。 これらの指向変化に対して堅牢かつ単純なラベルを付けるために、2p 電子の飛行時間の差が計算され、その結果 \(P_{02}\) (eTOF0 と反対側に位置する eTOF2 の比較) および \(P_{ 13}\) (eTOF1 を反対側に位置する eTOF3 と比較)。 これについては、補足情報 (SI) で詳しく説明されています。 「ベースライン 1」の外乱 \(B_{1}\) は、不連続性、つまり高い飛行時間値での鋭い「エッジ」特徴に関して eTOF0 を評価することで特定できます。 これは、トレース ベースラインのステップ後のエッジ前の 40 個の ADC チャネルの強度の合計を 40 で割った値を計算することによって識別されます。 2 番目の外乱 \(B_{2}\) (図 1 の「ベースライン 2」と「中心強度」を参照) は、各 TOF スペクトルの中心部分をカバーするより広範な特徴です。 これは、スペクトルの中心部分を合計し、スペクトルの最初と最後のスペクトル領域のデータの平均で割ることによって識別およびラベル付けされます。 データ収集では、4 つの ADC チップを時間インターリーブし、それぞれ 1.75 GS/s でサンプリングすることにより、7 GSamples/s の実効サンプリング レートが達成されます。 私たちは、ネットワークが系統的なインターリーブの欠陥を直接示す相関関係をエンコードしていることに気づきました。データの大部分で、各 eTOF チャネルのそれぞれのインターリーブ ADC のゲインは同一ではなく、データ内に特徴的なジグザグ構造が形成されています (図 1 のズームインと「ジグザグ」を参照してください)。 これは、すべての奇数とすべての偶数の ADC チャネルを個別に加算し、これら 2 つの合計を除算することで簡単にラベルを付けることができ、\(L_{0,1,2,3}\) というラベルが得られます。 光子エネルギーの場合、OPIS に依存しない値の 1 つは設定波長パラメータ \(\lambda _{FEL}\) であり、これはフラッシュ アクセラレータとアンジュレータのセットアップに対応する公称波長のみを表します。 実際の FEL 波長には、主に 2 つの要因により一定のオフセットが存在する可能性があります。 まず、アンジュレータセクションの電子ビームエネルギーは、FLASH2 抽出やバンチ圧縮などのビームステアリングコンポーネントにより、加速器セクションで測定されたエネルギー値から逸脱する可能性があります。シケイン18. 第二に、特に可変ギャップアンジュレータが波長走査用に調整されている場合、電子ビームの軌道がアンジュレータセクションの公称軌道から逸脱する可能性があります。 さらに、波長は通常 \(\sim\) 1%3 の帯域幅内で SASE プロセスにより変動します。この場合、これは約 2 eV の光子エネルギー帯域幅に相当します。 したがって、ラベル \(\lambda _{FEL}\) は、シングルショット光子のエネルギーに対して中程度の重要性しか持たない「推定」ラベルです。 さらに、磁気ボトルの実験 21 が私たちの研究と並行して行われ、そのデータは SI に示されている波長の相互参照として使用されています。

前述の特徴量エンジニアリング プロセスから得られるこれらのラベルは、図 2 のデータに対してネットワークが導出した \(z_{i}\) 値と比較されます。再構成の品質 (図 1 の黒い曲線) は印象的に優れています。 12 次元のボトルネックとしては高い。 ネットワークは 2p 光電子の正しい位置を見つけ、4 つの eTOF のそれぞれについて個別の MCP 応答関数を再構築し、相関のないランダムなイベントを破棄し、ベースラインの外乱を再現することもできます。 これらの発見に加えて、ネオン 2s ラインは、実際に光子エネルギーが飛行管の使用されたリターディング電圧を克服するのに十分に高い場合にのみ再構成に含まれます。 私たちのデータでは、214 eV ~ 226 eV の光子エネルギー範囲で Ne 2s のイオン化断面積が Ne 2p に比べて \(\sim\) 5 倍低く、2s フォトライン強度がより広い TOF 間隔にわたって広がっていることを考慮すると、これは印象的な結果です19。 Ne 2s の特徴は、生データから目視または従来の分析方法を使用して識別することはほとんどできません。 同様に印象的なのは、いわゆるプロンプト信号の再構成です。これは、MCP に当たる散乱光子によって生成され、固定 TOF 位置に別の小さなピーク特徴が生成されます。 この信号は、光電子の飛行時間を決定するための基準 t = 0 をマークするため、非常に重要です。

\(\beta\)-VAE ネットワークの構造 (a) と、基礎となる中心原理の教師なし符号化 (b)、つまり位置、強度、ベースライン、ポインティング、インターリーブが示されています。 密度プロットは、潜在空間とラベルの依存関係を表します。これは、高品質のデータ (データセットの 3%) を使用した従来のデータ分析によって導出されました。 対応する軸の値 (\(z_{i}\) とラベル) は、処理されたテスト サンプルの最小値と最大値が正規化されています。 すべてのスケールは線形です。

SASE-FEL 源でのほとんどの実験にとって重要な情報は、シングルショットの中心光子エネルギーです。 OPIS 測定では、z の 2 つの成分、つまり \(z_{0}\) と \(z_{1}\) にエンコードされる eTOF スペクトルのピーク位置に対応します。 \(z_{0,1}\) 位置マップでは、それぞれサイン関数とコサイン関数に似た依存関係を示します。 ただし、位置は完全なサイン/コサインまたは円の方法でエンコードされるわけではありません。 これは、次のように定義されるフェーズ \(\phi\) に結合されます。

従来の解析とニューラル ネットワークのパフォーマンスの比較: (a) ネットワークによる飛行時間位置の予測 (青) と、指定された \(\lambda _{FEL} での予想位置との比較) の平均差\) キャリブレーションによる誤差は、従来の分析で得られる平均誤差 (オレンジ色) よりも大幅に低くなります。 予想される帯域幅は TOF チャネル (赤) の STD に変換されます。 ニューラル ネットワークの予測による STD は帯域幅とほぼ同じです。 (b) \(\lambda _{FEL}\) の場合、ネットワークおよび従来の解析で決定された TOF 位置が、機器内で独立して決定された OPIS 機器の校正に従った校正曲線と比較されます。キャンペーンの委託。 (c) eTOF の異なる位置にいくつかのピークがあるショットの例 (灰色) が示されています。 指定された帯域幅内で予想される位置は赤色で表示されます。 従来の解析ではどのピークを実際の光電子信号として指定するかを決定できませんが、ネットワークは生データ内の他のすべてのピークを無視して正しい位置にピークを再構成します。

最も正確な波長を提供するために、\(\phi\) は追加のニューラル ネットワークで補正されます。 4 つの eTOF すべてが波長について同じ情報を提供するデータの一部 (3% の高品質データ)、つまり、同様の位置にある鮮明なフォトラインは、完全接続多層パーセプトロン (MLP) のトレーニングに使用されます24。 この MLP は、\(\phi\) を 4 つすべての eTOF からの 2p ピークの平均最小二乗近似 TOF 位置に投影します (補足情報を参照)。 このメソッドのパフォーマンスは 3 つの要素で評価されます: (a) 従来のデータ分析の結果 (「メソッド」セクションを参照)、(b) \(\lambda _{FEL}\)、および (c) 中央値と比較されます。磁気ボトル実験の質量(補足情報を参照)。 \(\lambda _{FEL}\) との比較は、ネットワークおよび従来の解析に対して図 3b に示す OPIS の検量線を使用して行われます。 結果を図 3a にまとめます。 TOF チャネルにおけるネットワークの予測の平均差は、従来の方法と比較して 2 倍小さくなります。 FEL の推定帯域幅は、TOF チャネルの標準偏差値 (STD) に変換されます。 この帯域幅の STD はネットワークの予測の STD に近いですが、従来の結果はさらに大きく異なります。 ネットワークが従来の分析よりも優れていることを示すために、図 3c に分析が難しいショットを示します。 同様の振幅を持つ複数のピークが異なる TOF 位置に現れています。 帯域幅を含む \(\lambda _{FEL}\) は、光電子が期待される領域を示すために示されています。 ネットワークは、図 3c に示すように、正しい領域にピークを再構成します。 対照的に、従来の方法では正しいピークを特定するのが困難です。 SASE変動に依存しない比較として、予測された波長は、私たちの研究と並行して実行されていた磁気ボトル実験における2-チオウラシルからの硫黄の2pフォトラインの質量中心とも比較されます。 ここでも良好な一致が見つかり、これが SI に示されています。

波長の検索に加えて、教師なしトレーニング プロセス中に他の複数の特徴が潜在空間にエンコードされます。 ネットワークは、図 2 にプロットされている \(z_{2}\)、\(z_{3}\)、および \(z_{4},\) の 4 つの eTOF の強度分布をエンコードします。図 2 に示すように、1}\) と \(B_{2}\) は、z の 2 つの別々のコンポーネント、つまり \(z_{4}\) と \(z_{5}\) にエンコードされます。興味深いことに、 \(B_{1}\) はパルス列の 2 つの特定のバンチでのみ発生し、\(B_{2}\) は 1 つのバンチのみに限定されます (バンチ番号と \(z_{i}\) のマップを参照) )、加速器環境から誘発される同期電子ノイズが原因であることを示しています。 \(B_{1}\) と \(B_{2}\) はオン/オフ状態でエンコードされるため、\(z_{4}\) と \(z_{5}\) は極値を使用できます。領域を「オン」に設定し、ベースライン外乱が「オフ」の間、値範囲の残りの部分を別の特徴のエンコードに使用できます。 その結果、\(z_{4}\) は eTOF3 の強度もエンコードし、\(z_{5}\) は \(P_{13}\) もエンコードします。 ネットワークは、他のポインティング関連ラベル \(P_{02}\) に z の 6 次元を使用します。 \(z_{5}\) 対 \(P_{13}\) の線形依存関係と、\(z_{4}\) 対 \(P_{13}\) の交差状の依存関係を組み合わせると、空間ビーム位置の変動を決定するために使用できるようになりました。これは実験の重要なパラメータにもなり得ます。 \(L_{0,1,2,3}\) は \(z_{7}\) で完全にエンコードされます。 コンポーネント \(z_{8-11}\) は再構築にわずかな影響しか与えないため、未使用とみなされます。 ただし、潜在空間の次元を減らすと全体的な損失が増加し、その結果、手作りのラベルのエンコードがより複雑になります。

データクリーニングの例: 生データ (灰色) は、黒で示されているようにネットワーク経由で再構築されます。 すべてのランダム ヒットが破棄され、ノイズ レベルが低減され、プロンプト信号が再構築されます。 潜在空間を変更すると、インターリーブの問題が解決され、ベースラインの乱れ (マゼンタ) が除去されます。

ネットワークのみによるデータの再構築では、生データからランダム ヒットがすべて自動的に削除されます。 さらに、ベースラインのノイズ レベルが大幅に減少します。 最後に、ネットワークの両方の部分で、エンコーダを使用して個々のサンプルの 12D 表現を取得することができ、その結果、図 4 に示すように、これらすべての影響について侵害されたデータを選択的に除去できます。表現が理解できたら、 \(z_{7}\) を 0.8 (この特定のサンプルを最適に再構築するためにネットワークによって決定された) から平均値 0.0 に変更し、次のようにデコーダを実行するだけです。この変更された \(z_{7}\) 値により、インターリーブ効果を排除することができます。 同様の手順 (補足情報を参照) を使用して、ベースラインの乱れを除去できます。

SASE動作モードにより大きく変動する光子特性を伴うFEL放射を供給する超伝導加速器を備えたFELマシンの高繰り返し率を最大限に活用するには、重要なパラメータに関する情報がシングルショットベースで必要となります。 理想的には、この情報は、実行中のユーザー実験と並行して動作できる、完全に独立した診断デバイスによって提供されるべきです。 このようにして、ほぼリアルタイムの方法であっても可能な限り最良の分析が可能になり、調査中の物理プロセスの光子特性への依存関係を明らかにするために、データのソート、ビニング、および同様の方法のあらゆる可能性が可能になります。 。 これは、多数の単一光子相互作用イベントの蓄積に依存するコインシデンス測定など、光子を大量に必要とする実験手法にとって特に重要です。 フォトン プロパティのさまざまな値をカバーするデータ サンプルを平均することで、依存関係の効果がぼやけたり、さらには隠蔽されたりすることを回避できます。 OPIS をトレーニング済み \(\beta\)-VAE ネットワークと組み合わせると、そのような機能が提供され、FEL プロパティの「波長」を実験データ分析の独立した並べ替えパラメーターとして使用できるようになります。 次のステップは、より一般的なネットワークをトレーニングすることです。 OPIS 動作パラメータ、つまりターゲットガス種、チャンバ圧力、eTOF のリターディング電圧は、この研究で示される結果に対して固定値に保たれています。 これらのパラメーターのさまざまな組み合わせのスペクトルを記録しており、今後も記録する予定です。 まず、専用ネットワークがさまざまな操作パラメータに対してトレーニングされます。 この場合、動作モードごとに特定のネットワークをオンライン分析に使用できます。 第 2 に、すべての操作パラメータに対して 1 つのネットワークのみがトレーニングされるため、すべての操作モードで同じネットワークを使用できます。 次に、これら 2 つのアプローチを比較します。

私たちは、最適化された \(\beta\)-VAE ネットワークが、事前知識なしで教師なしの方法で、高次元光電子飛行時間分光データの基礎となる中心原理を見つけることができることを示しました。 信号対雑音比が低いすべての生データはノイズ除去され、観察された光イオン化プロセスと相関関係のないランダム ヒットは破棄されます。 その結果、再構成されたスペクトルははるかに高品質になり、場合によっては、生データでは不明瞭で従来の分析方法では簡単に処理できない光電子の特徴を非常に明確に示すことができます。 潜在空間での表現はスペクトルの主要な固有の物理的特性をすべてカバーし、シングルショット FEL 波長などの重要な情報への直接アクセスを提供します。 トレーニング済みネットワークの推論時間は速いため、フォトン診断測定中にオンライン ツールとして導入でき、FLASH ユーザー実験に重要な情報をリアルタイムで提供できます。 これにより、オンザフライのデータ分析が可能または改善され、ビームタイムの効率を向上させることができます。 たとえば、調査対象の効果について統計の観点からデータの品質を監視することにより、記録時間と結果の評価を最適化できます。 この付随分析により、ユーザーは実験キャンペーン全体を通じて測定値をその場で適応させることができます。 さらに、オフラインの実験後のデータ分析でも、\(\beta\)-VAE ネットワークによって提供されるラベルの恩恵を受けることができます。 この点において、データの特定のプロパティを表す VAE の値をゼロに設定することで、そのプロパティを分離または削除できる機能は、データ セットの詳細な分析に非常に役立つ可能性があります。

OPIS で正確な波長測定を行うには、機器の校正が必要です。 OPIS の試運転キャンペーンでは、運動エネルギーを測定された飛行時間の値に割り当てる変換関数が、リターデーション電圧設定ごとに経験的に決定されています。 これらの校正測定では、光子エネルギーまたは電子の運動エネルギーのいずれかが正確にわかっていました (式 (2))。 これは、基準として光学回折格子分光計を使用した同時測定と、オージェプロセスによる固有の校正機能の使用によって達成されています。 オージェ電子は、オージェ遷移に関与する 2 つの電子軌道の差に対応する固定の運動エネルギーで放出されるため、TOF スペクトルにおける直接の運動エネルギー マーカーとして機能します。 さらに、特定の軌道の光線のTOF位置がオージェ線の位置と正確に一致するまでFEL波長を調整するスキームを使用することができる。 これにより波長も決まり、同じスペクトル内の他の光電子線の TOF 位置での運動エネルギーが決まります。 OPIS キャリブレーションの詳細については、参考文献 9、10 を参照してください。

表 1 は、 \(\sim\) 700 ネットワークの学習中に調査されたハイパーパラメーター空間を示しています。 バッチ サイズ、\(\beta\) パラメーター、学習率、エポックごとのサンプルは、固定値およびスケジュール プロセス内でテストされました。 潜在空間の MSE 再構成損失と KL ダイバージェンスもつれ解除損失を組み合わせた全体的な損失の評価とは別に、手作りのラベルを使用した潜在空間の解釈可能性に関するネットワークの評価が行われました。再構成損失については、絶対誤差 (AE) とバイナリクロスエントロピー (BCE) もテストされました。 図 2 の z のコンポーネント (およびテキスト) は、読みやすくするために並べ替えられています。 確率的勾配降下オプティマイザー (SGD) の場合、運動量は 0 から 0.9 までテストされました。 4,000 万のサンプルは、それぞれ 100 万のサンプルを含む 40 の単一の hdf5 ファイルに分割され、ランダムにシャッフルされます。 これらのファイルのうち 33 個はトレーニングに使用され、100 万個のサンプルはトレーニング プロセス中の検証データとして使用され、残りの 600 万個はトレーニング後のネットワークのテストに使用されます。 データ読み込みの目的で、1 エポックは、ネットワークが 1 つのファイル、つまり 100 万サンプルを処理する最適化ステップとして定義されます。 トレーニング中、ネットワークは、データが別のファイルからの別の 100 万サンプルに置き換えられるまで、一定のエポック数にわたって同じ 100 万サンプルを使用してトレーニングを続けます。 データの固定された 100 万サンプル部分に関するデータの記憶は、非常に深いネットワークでのみ観察され、また数千エポック後にのみ観察されます。 この効果により、メモリ内のトレーニング データは 10 エポックごとに置き換えられ、オーバーフィッティングが発生しないようにしながら、ネットワークのトレーニングに使用される GPU への高速データ転送が可能になります。 このトレーニング方法が最終結果を損なうことがないことを示すもう 1 つの指標は、データ セットが 10 エポック後に置き換えられた場合に損失関数に急激な変化が観察されないことです。 同じデータのエポック数が 1 に設定されている場合、プロセスは 3300 万サンプルのトレーニング データ全体を 33 エポックごとに処理すると解釈できます。 データは最小-最大正規化されています。つまり、8 ビットの垂直整数範囲 [0,255] が区間 [0,1] の浮動小数点値に変換されました。

\(z_{0}\) と \(z_{1}\) の位相補正の MLP には次のネットワーク アーキテクチャがあります。

一方、入力は位相であり、予測ターゲットは 4 つの eTOF スペクトルすべてをフィッティングすることによって導出された平均 TOF 位置によって与えられます。 Mish アクティベーションと Adam オプティマイザーが使用され、200,000 サンプル、バッ​​チ サイズ 100、学習率 \(10^{-5}\) で 2000 エポックにわたってトレーニングされました。 データは正規化されていませんでした。 予測品質は MSE で測定されました。

シングルショットの生データを堅牢かつ効率的に処理するために、複数の方法がテストされました。 データが \(\lambda _{FEL}\) とどの程度一致するかについて比較が行われました。 最良の結果は、図 3c のズームイン領域に対応する関心領域、TOF チャネル [600、1000] のみを分析する反復手順によって達成されました。 まず、4 つすべての eTOF で考えられるすべてのピーク位置を決定するために、しきい値 0.2 (図 1 に示す値に対して) が設定されます (1 つの eTOF で複数のピークが可能です)。 これらのピーク位置は、最大位置の整数値です。 次に、すべての検出器のピーク位置が比較されます。 複数の検出器の 20 TOF チャネルの同じウィンドウ内に複数のピークがある場合、これらのピークのさらなる処理が実行されます。 それ以外の場合、1 つのピークの振幅が (絶対値 0.15 だけ) 大きい場合は、この 1 つのピークに対してのみさらなる処理が実行されます。 そうでない場合は、見つかったすべてのピークに対して処理が続行されます。 次に、残りのすべてのピーク位置が、ピークの質量中心を (浮動小数点精度で) 計算することによって最適化されます。 さらに、他の分析方法 (最小二乗最適化フィット ルーチンなど) がより適切であるかどうかも確認されました。 これらの他の方法を使用しても利点はなく、計算時間が大幅に増加するという欠点が生じることがわかりました。 決定されたすべてのピーク位置の平均値が最終結果として採用されます。

現在の研究中に使用および分析されたデータセット、およびニューラル ネットワークのトレーニング プロセスのコードは、合理的な要求に応じて責任著者から入手できます。

Kondratenko, AM & Saldin, EL アンジュレーター内の相対論的電子ビームによるコヒーレント放射の生成。 一部。 アクセル。 10、207–216 (1980)。

CAS Google スカラー

Zhirong, H. & Kwang-Je, K. X 線自由電子レーザー理論のレビュー。 物理学。 Rev.ST Accel. ビームス 10(3)、034801 (2007)。

記事 Google Scholar

アッカーマン、W.ら。 極端紫外から水の窓までの波長範囲における自由電子レーザーの動作。 ナット。 フォトニクス 1、336–342 (2007)。

記事 Google Scholar

ソロキン、A.ら。 自由電子レーザー用X線ガスモニター。 J.シンクロトロン放射。 26、1092–1100 (2019)。

論文 CAS PubMed PubMed Central Google Scholar

Tiedtke, K. et al. X線レーザー用ガス検知器。 J.Appl. 物理学。 103、094511 (2008)。

記事 Google Scholar

グルグラシュ、I. et al. 自由電子レーザーにおける超高速 X 線パルスの特性評価。 ナット。 フォトニクス 6、852–857 (2012)。

記事 Google Scholar

Frühling, U. et al. シングルショット THz フィールド駆動 X 線ストリーク カメラ。 ナット。 フォトニクス 3、523–528 (2009)。

記事 Google Scholar

ハートマン、N.ら。 X線自由電子レーザーパルスのアト秒時間エネルギー構造。 ナット。 フォトニクス 12、215–220 (2018)。

記事 CAS Google Scholar

Braune, M. et al. FLASH2 用の非侵襲的なオンライン光イオン化分光計です。 J.シンクロトロン放射。 23、10–20 (2016)。

論文 CAS PubMed PubMed Central Google Scholar

Braune, M. et al. FLASH2 および現在のベンチマークでの非侵襲的なオンライン波長測定。 J.シンクロトロン放射。 25、3–15 (2018)。

記事 PubMed PubMed Central Google Scholar

ウォルター、P.ら。 将来の自由電子レーザー実験用の多重解像度電子分光計アレイ。 https://arxiv.org/abs/2103.07603。

クリストファー M ビショップ、パターン認識と機械学習 (Springer、ベルリン、2006)。

数学 Google Scholar

Kramer, M. 自己連想ニューラル ネットワークを使用した非線形主成分分析。 AIChE J. 37(2)、233–243 (1991)。

記事 CAS Google Scholar

An, J., & Cho, S. 変分オートエンコーダベースの再構成確率を使用した異常検出。 IE特別講義 Vol. 2 (2015)。

Kingma, DP & Welling, M. 変分オートエンコーダの紹介。 見つかった。 トレンドマッハ。 学ぶ。 12(4)、307–392 (2019)。

記事 MATH Google Scholar

Higgins, I. et al.\(\beta\)-VAE: 制約された変分フレームワークを使用して基本的な視覚概念を学習します。 ICLR 2017 で会議論文として出版されました。

バージェス、C.ら。 \(\beta\)-VAE でのもつれの解除を理解する。 http://arxiv.org/abs/1804.03599。

Faatz、B.ら。 1 つの線形加速器で駆動される 2 つの軟 X 線自由電子レーザーを同時に動作させます。 新しい J. Phys. 18、062002 (2016)。

記事 Google Scholar

Wuilleumier, F. & Krause, MO 100 ~ 2000 eV のネオンの光イオン化: 単一プロセスと複数プロセス、角度分布、およびサブシェル断面。 物理学。 Rev. A 10、242 (1974)。

記事 CAS Google Scholar

Kullback, S. & Leibler, RA 情報と十分性について。 アン。 数学。 統計 22(1)、79–86 (1951)。

記事 MathSciNet MATH Google Scholar

Metje, J. et al. URSA-PQ: FLASH 自由電子レーザーでの気相サンプル用の可動式で柔軟なポンププローブ機器。 応用科学。 10(21)、7882 (2020)。

記事 CAS Google Scholar

Misra, D. Mish: 自己正規化された非単調活性化関数、2019 年 8 月 23 日に提出 (v1)、最終改訂日 2020 年 8 月 13 日 (v3)。 https://arxiv.org/abs/1908.08681。

Kingma, D. & Ba, J. Adam: 確率的最適化の手法。 2014 年 12 月 22 日に提出 (v1)、最終改訂日 2017 年 1 月 30 日 (v9)。 https://arxiv.org/abs/1412.6980。

Hastie, T.、Tibshirani, R. & Friedman, J. 統計学習の要素: データ マイニング、推論、予測 (Springer、ベルリン、2009 年)。

MATH を予約する Google Scholar

リファレンスをダウンロードする

著者らは、ヘルムホルツ協会 HGF のメンバーである DESY (ドイツ、ハンブルク) に実験施設を提供していただいたことを認めます。 この研究の一部は FLASH2 で実施されました。 GH は、\(\beta\)-VAE のアプリケーション、解釈、プレゼンテーションについて有益な議論をしてくれた Irina Higgins に感謝します。 彼らは、ベルリン・ヘルムホルツ・ツェントラム・フェル・マテリアル・アンド・エネルギーとカッセル大学との間のジョイント・ラボラトリー人工知能実験計画法(AIM-ED)の支援とサポートに感謝します。 BMBF プロジェクトのイノベーションスプールによって一部資金提供されています: Data-X - 光子および中性子科学のためのデータ削減。 BMBF プロジェクト: 05K20CBA によって一部資金提供されています。 私たちは、レントゲン・オングストローム・クラスター (RÅC) プログラム (番号 2019-06093) を通じたスウェーデン研究評議会からの財政的支援に感謝します。

Projekt DEAL によって実現および組織されたオープンアクセス資金調達。

Helmholtz Center Berlin for Materials and Energy GmbH、Albert-Einstein-Strasse 15、12489、ベルリン、ドイツ

グレゴール・ハルトマン、ピーター・フォイアー=フォーソン、デヴィッド・マイヤー、フェリックス・メラー、ルイス・ベラ・ラミレス、イェンス・フィーフハウス

ドイツ電子シンクロトロン (DESY)、Notkestrasse 85、22607、ハンブルク、ドイツ

ゲサ・ゲツケ、シュテファン・デュステラー、マルクス・ゲール、カイ・ティートケ、マルクス・ブローネ

ポツダム大学物理天文学研究所、カール・リープクネヒト・シュトラーセ 24/25、14476、ポツダム・ゴルム、ドイツ

ファビアーノ・レバー & マルクス・ゲール

インテリジェント組み込みシステム、カッセル大学、Wilhelmshöher Allee 73、34121、カッセル、ドイツ

デビッド・マイヤー

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

GH と MB は、すべての著者からの意見をもとに原稿を共同執筆しました。 MB は OPIS 機器を設計し、試運転しました。 MB、SD、FL、KT、MG は実験を実施し、使用したデータを記録しました。 GH は、この研究のために \(\beta\)-VAE コードを作成しました。 FL は磁気ボトルのデータのデータ分析を実行しました。 GH、GG、PF、LV、DM、FM、SD、MB、JV は、\(\beta\)-VAE ネットワークを解釈して最適化しました。

グレゴール・ハルトマンへの通信。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Hartmann, G.、Goetzke, G.、Düsterer, S. 他光子診断のための解絡変分オートエンコーダーを介した教師なし現実世界の知識抽出。 Sci Rep 12、20783 (2022)。 https://doi.org/10.1038/s41598-022-25249-4

引用をダウンロード

受信日: 2022 年 6 月 21 日

受理日: 2022 年 11 月 28 日

公開日: 2022 年 12 月 1 日

DOI: https://doi.org/10.1038/s41598-022-25249-4

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。

共有