開発中のマルチオミクスデータ相関解析プログラムを対象に、統計処理の妥当性検証と技術的な改善提案を実施しました。また、処理性能のボトルネックを特定し、並列化と出力形式の変更による高速化実装のサポートを行いました。その結果、全体の処理時間は約25%削減、ファイル出力部分は約90%の削減を達成しました。また、ゲノムワイドな解析拡張(trans探索)に向けた実現可能性の検討と、段階的な設計案の提示も担いました。
課題と対応
課題
- 相関解析プログラムの統計ロジックの妥当性について文書化が必要
- プログラム本体と関連スクリプト間の統計処理の整合性を検証したい
- ゲノムワイドなtrans探索拡張に向けた計算性能のボトルネックを把握したい
対応
- 統計処理の各観点(検定統計量とp値の整合性・Fisher z変換の要否など)を評価し、改善提案を文書化
- 染色体単位の並列化と出力フォーマットのParquet化により処理速度を改善した
- trans探索の計算負荷試算と段階的設計案の提示
プロジェクト情報
| 関係機関 / お取引先名 | 国立研究機関様 |
|---|---|
| カテゴリ | |
| キーワード |
AI・データ・サービスへの
ご相談はいつでも承ります
ご相談はいつでも承ります