MOOS08  加速器技術(制御2)  8月5日 シンポジオン会議室 13:20 - 13:40
Hadoop・HBaseを利用したJ-PARC運転データアーカイビングの現状
Status of J-PARC operation data archiving using Hadoop and HBase
 
吉位 明伸,○菊澤 信宏,池田 浩,加藤 裕子(原子力機構)
Akinobu Yoshii, ○Nobuhiro Kikuzawa, Hiroshi Ikeda, Yuko Kato (JAEA)
 
J-PARC (Japan Proton Accelerator Research Complex) においては多数の機器により制御されており、Linac、RCSに関して約64000点にも及ぶEPICSレコードのデータを収集している。現状ではRDBMSのPostgreSQLを利用したシステムにてデータアーカイブを行なっているが、性能や拡張性に対する諸問題に対応するため、分散処理フレームワークのHadoopと分散データベースのHBaseを利用した次世代アーカイブシステムについて検討し、テストシステムの実装と利用を行なっている。 Hadoop・HBaseのシステムにおける運用上の問題点としてマスターノードが単一障害点となる事が挙げられるが、これに対しては2台のサーバをHeartbeatとPacemakerを用いたHA (High Availability) クラスタ構成にしてシステム可用性を向上させている。また、DRBDを用いて2台のサーバ間のデータ同期を行うことによりデータ管理に重要なメタデータを保護している。9台のスレーブノードを用いて合計約50TBのHDFSファイルシステムを構築し、この上でHBaseを稼働させている。 現在、試験的にLinacにおける約6500点のEPICSレコードのデータを現行と同じ1〜60秒周期で収集しており、特段問題無くアーカイブが行えている。また、データ検索に関しては、現行システムと比較して応答時間が最大で1/5程度にまで短縮されている。 本発表では、このアーカイブシステムの現状や課題並びに今後の展望について報告する。