大規模マテリアルデータ基盤を構築・共用開始 〜国内26機関連携により、科学と産業を支える知のインフラを整備〜

共用設備の利用により創出された約11万件のマテリアルデータの共用サービスが開始されます

広島大学半導体産業技術研究所では、2002年からの文部科学省ナノテクノロジー総合支援プロジェクト、2007年からの文部科学省ナノテクノロジーネットワーク事業、2012年からの文部科学省ナノテクノロジープラットフォーム事業、そして現在の文部科学省マテリアル先端リサーチインフラ(ARIM)事業に至る全国共用設備プロジェクトに参画し、20年以上全国をカバーする共用設備事業の中核機関としての役目を担っています。ARIMでは、従来の設備装置共用に加え、共同装置事業で生み出される有用なデータを更に活用するデータ共用化を進めています。この度、共用設備の利用により創出された約11万件のマテリアルデータの共用サービスが開始します。

文部科学省「マテリアル先端リサーチインフラ(ARIM)」事業では、大学や研究機関等に設置された電子顕微鏡や分光分析装置など、最先端の設備群を全国的に共用できる体制を整備しています。また、設備利用を通じて創出されたマテリアルデータを、装置ごとに異なる計測データや合成・加工プロセスデータの形式を統一化し、機械学習などにも活用しやすい形態に整えた構造化データとして収集・蓄積しています。これらのデータは今後も設備の利用状況に応じて継続的に増加していく予定です。

この度、ARIM事業によって収集・整備された約11万件のマテリアルデータが、2025年9月30日より日本の学術界・産業界へ向けて共用開始されます。共用データの利用希望者は、所定の利用料を支払うことにより、当該データをダウンロードして利用することが可能となります。多様な設備群とそれを活用する幅広い研究者から創出された多種多様なデータの特性を生かし、実験条件設定支援・計算データ等との統合活用・教育コンテンツ等への展開が、研究活動における課題解決や新たな知見の創出等に資するユースケースとして考えられます。また装置ごとに異なるデータ形式を統一化により、データ駆動型マテリアル研究開発のさらなる加速が期待されます。​

データ共用サービスの概要・特徴
  • サービス開始:2025年9月30日予定
  • 提供するデータ:ARIMにおいて共用する約1,200台の機器を利用する研究から創出された、各種測定値、グラフ、画像など豊富なマテリアルデータに関する構造化データを、ダウンロードして利用することが可能。これらには実験条件に関する情報やサンプル情報等のメタデータが含まれる。
  • 利用可能な構造化データ件数:約11万件(2025年7月時点)
  • 新しい構造化データは随時追加され、年間数十万件ずつ増加見込み。
  • データの特徴:装置ごとに異なるデータ形式を統一化し、AIや機械学習などにもデータの利活用が可能。失敗データを含む様々な実験データを蓄積。各種材料について、物性値・測定・解析データのほか、材料の合成や半導体・デバイス加工における温度や圧力などの実験条件、プロセスデータ等も紐づけ。
データ共用サービスの利用方法など
関連リンク