meta-something

論文とか研究とか趣味のネタとか

SIGBIO49(とOpen-BIO21)で発表してきました

2017年3月23日に北陸先端大学(JAIST: Japan Advanced Institute of Science and Technology)で開催された、第49回情報処理学会 バイオ情報学研究会(SIG BIO 49)に参加して研究報告をしてきました。

タイトル

  • 『コンテナ型仮想化による分散計算環境におけるタンパク質間相互作用予測システムの性能評価』
  • 『Evaluation of Container Virtualized MEGADOCK System in Distributed Computing Environment』

概要

本研究室で開発されたタンパク質間相互作用予測システムMEGADOCKについて,クラウド上に構築したコンテナ型仮想化による分散計算環境を用いて計算性能の評価を行う. コンテナ型仮想化技術としてLinuxコンテナの実装の1つであるDockerを採用し,仮想マシンの並列数を増加させた際の並列実行性能を調査する.

We evaluate the performance of MEGADOCK system using container virtualization technology in distributed computing environment on cloud. MEGADOCK is a Protein-Protein-Interaction Prediction System for heterogeneous supercomputers. We chosed Docker as a container virtualization technology for Linux container implementation and evaluated parallel execution performance while increasing the number of virtual machines.

ということで

  • Dockerコンテナイメージを作成して何もしない状態からの性能変化を計測
  • 対象はバイオインフォマティクス領域の極めて計算律速なアプリケーション(MEGADOCK
  • 実験は単一ノード実行と並列ノード実行で2種類
    1. ローカルの物理マシン1台上で、通常時とコンテナ内で実行性能を比較(GPU使用も含む)
    2. クラウド環境上の仮想マシン複数台で、MPI並列時の実行性能を比較
  • 結論:計算処理は若干落ちる(0~6%)が、GPU処理の影響はほぼない。クラウド環境上の並列実行時は差はほとんど見えなかった。

クラウド環境のGPUインスタンスを利用してMPI+GPU並列の計測をしたかったものの、DockerからGPUを使うためのNVIDIA-Dockerが、クラスタ上のコンテナ管理のためのDockerSwarmに現時点で対応してなかったため、報告では断念。Kubernetesとか使うとできそうなので、別の場所に報告するつもりです。

スライド

speakerdeck.com

Citation

日本語

青山健人, 山本悠生, 大上雅史, 秋山 泰, “コンテナ型仮想化による分散計算環境におけるタンパク質間相互作用予測システムの性能評価”, 情報処理学会研究報告 バイオ情報学, 2017-BIO-49(3) pp.1-8, 2017.

英語

Kento Aoyama, Yuki Yamamoto, Masahito Ohue, Yutaka Akiyama, “Evaluation of Container Virtualized MEGADOCK System in Distributed Computing Environment”, IPSJ SIG Technical Report, 2017-BIO-49(3), pp.1–8, 2017.


第21回 オープンバイオ研究会

github.com

少しあとに共同開催されたオープンバイオ研究会で、全員参加型の「4コマプレゼン」というライトニングトークのようなセッションがあったので、コンテナ型仮想化の宣伝とMEGADOCKのサンプル実行のデモを行いました。

スライドは即興で作成したものなのでクオリティは低めです。

qiita.com

ゆるふわなDockerの使い方(Docker布教)

Speaker Deck

speakerdeck.com

なにこれ

研究室でDockerの使い方を布教したときのスライドです。 ゆるふわに「とりあえずどんな感じで使えるのかわかればいいや」という感じの内容です。

なんでそんなことを

  • 個人が使う場合でも便利なツールだから
    • 研究領域のアプリケーション配布にもDockerがもっと普及して欲しい
  • 自身の研究を話すときの理解の助けになる
    • 味方を増やしたいのと、人に説明する練習として
  • 東工大が2017年夏に稼働を予定するスパコンがコンテナ型仮想化を前提にするらしい(?)ので、コンテナ型仮想化について知っておいて損はない

個人的な参考資料とか

www.slideshare.net

www.slideshare.net

論文紹介『An Updated Performance Comparison of Virtual Machines and Linux Containers』

タイトル

An Updated Performance Comparison of Virtual Machines and Linux Containers

著者

Wes Felter ♰ , Alexandre Ferreira ♰ , Ram Rajamony ♰ and Juan Rubio ♰
IBM Research Division, Austin Research Laboratory

発表媒体

  • IBM Research Report, RC25482 (AUS1407-001), 2014.
  • IEEE International Symposium on Performance Analysis of Systems and Software, pp.171-172, 2015.

概要

Linux Container (Docker)と Virtual Machine (KVM)を比較対象に CPU, メモリ, ネットワークI/O, ファイル I/O の性能をベンチマークや DB を利用した模擬アプリ等を利用して計測した論文. 設定に依存するが Docker は KVM と同等またはそれ以上で,実環境に近い性能を示している.

スライド(英語)

speakerdeck.com

その他、日本語の紹介文献

blog.yuuk.io speakerdeck.com