本文へ移動

サイトナビゲーションへ移動

検索ボックスへ移動

サイドバーへ移動

ここは、本文エリアの先頭です。

ウェアラブルなヒト飛行システムの構築

JAXAスーパーコンピュータシステム利用成果報告(2023年2月~2024年1月)

報告書番号: R23JDA201S01

利用分野: 航空技術

PDFはここからダウンロード

  • 責任者: 又吉直樹, 航空技術部門航空利用拡大イノベーションハブ
  • 問い合せ先: 和田大地(wada.daichi@jaxa.jp)
  • メンバ: 久田 深作, 大瀬戸 篤司, 和田 大地

事業概要

山岳救助や災害救助の現状では, 少ない情報に基づいて救助計画を立てていることで, オペレーション全体の効果や安全性が限定されることがある. そこで, 迅速に隊員を現場投入できるヒト飛行システムを研究開発する. 情報収集や現場判断により確度の高い救助計画を可能にする.

参照URL

なし

JAXAスーパーコンピュータを使用する理由と利点

飛行システムの制御器を深層強化学習により生成する. そのためにJAXAスパコンを利用する. 深層強化学習ではマルチコアによる並列計算が必要であり, 加えてパラメータスタディのために複数ジョブを実行できれば効率的である. これらを可能にする点で, スパコンの大きな利点がある.

今年度の成果

深層強化学習を適用し,スラストベクタリングを備えたUAVモデルの姿勢制御を行った.

ジンバル実験系を想定した3自由度制御である(図).

姿勢変化が大きいため, クォータニオンフィードバックを制御系に組み込んだ.

深層強化学習のペナルティに移動平均を組み込むことで, 制御コマンドの振動が抑制され, スムーズで安定した制御が可能になった. また, 姿勢制御のペナルティとして, 目標姿勢角とのオイラー角の差を使用した場合よりも, 偏差クォータニオンを使用した場合のほうが制御が安定し, 学習にかかる時間も低減できることがわかった. さらに, 物理量としては特に意味のないクォータニオンの差分をペナルティとして使用した場合でも, 偏差クォータニオンと同等の性能・学習時間を示し, 強化学習の学習パラメータとして有用であることがわかった.

Domain randomizationを応用して学習したことで, ニューラルネットワークはシミュレーションと実環境の違いに適応し, チューニングなしに実験において制御可能であることが期待される(実験にて検証予定).

Annual Reoprt Figures for 2023

図1: ジンバル実験系によるUAVモデルの姿勢制御試験の様子.

 

成果の公表

なし

JSS利用状況

計算情報

  • プロセス並列手法: OpenAI Gym 及び PyTorch の実装に依る.
  • スレッド並列手法: OpenAI Gym 及び PyTorch の実装に依る.
  • プロセス並列数: 1 – 36
  • 1ケースあたりの経過時間: 72 時間

JSS3利用量

 

総資源に占める利用割合※1(%): 0.08

 

内訳

JSS3のシステム構成や主要な仕様は、JSS3のシステム構成をご覧下さい。

計算資源
計算システム名 CPU利用量(コア・時) 資源の利用割合※2(%)
TOKI-SORA 0.00 0.00
TOKI-ST 5381.01 0.01
TOKI-GP 136423.28 1.77
TOKI-XM 0.00 0.00
TOKI-LM 432.01 0.03
TOKI-TST 0.00 0.00
TOKI-TGP 0.00 0.00
TOKI-TLM 0.00 0.00

 

ファイルシステム資源
ファイルシステム名 ストレージ割当量(GiB) 資源の利用割合※2(%)
/home 0.00 0.00
/data及び/data2 0.00 0.00
/ssd 0.00 0.00

 

アーカイバ資源
アーカイバシステム名 利用量(TiB) 資源の利用割合※2(%)
J-SPACE 0.00 0.00

※1 総資源に占める利用割合:3つの資源(計算, ファイルシステム, アーカイバ)の利用割合の加重平均.

※2 資源の利用割合:対象資源一年間の総利用量に対する利用割合.

 

ISV利用量

ISVソフトウェア資源
利用量(時) 資源の利用割合※2(%)
ISVソフトウェア(合計) 0.00 0.00

※2 資源の利用割合:対象資源一年間の総利用量に対する利用割合.

JAXAスーパーコンピュータシステム利用成果報告(2023年2月~2024年1月)