HEALTH DATA COMPLIANCE
Health Data — 配布・利用制約を踏まえた設定ガイド
- 要点(health.gov.au の観点):
- 多くの公的医療データは用途・同意・匿名化要件や管理枠組みがある(例: HCP/PHDB/NIHSI/EDW)。
- データ分類・ガバナンス(Data Governance Framework)があり、保管・共有・利用にポリシーが適用される。
-
一部データは公開だが、研究利用や詳細アクセスは申請/承認・契約(DUA)を要する。
-
設定で取り入れるべき項目(
config/connectome_config.yamlに追加推奨): access_type: "public" | "restricted" # 自動ダウンロード可否を判断requires_approval: true/falseapproval_contact: "email@custodian.gov.au" # 申請先data_classification: "sensitive" | "public"duc_required: true/falseduc_url: "https://..." # DUA/DUC の参照先ci_download_secret: "CONNECTOME_DOWNLOAD_URL" # CI に置くシークレット名(制限データの場合は必須)storage: { encrypted: true, allowed_environments: ["secure_cluster"] }-
provenance: { source_url: ..., version: ..., contact: ... } -
例(sources 内の dataset エントリの拡張例):
hpd_restricted_dataset: dataset_id: "hpd_2024" source_url: "https://data.custodian.gov.au/hpd/metadata" format: "json" access_type: "restricted" requires_approval: true duc_required: true duc_url: "https://custodian.gov.au/duc" approval_contact: "data.custodian@agency.gov.au" data_classification: "sensitive" storage: encrypted: true allowed_environments: - "secure_cluster" ci_download_secret: "HPD_DOWNLOAD_URL"
- CI と自動化の注意点:
access_type: restrictedやrequires_approval: trueの場合、自動で公開サイトから直接ダウンロードするワークフローは避ける。- CI で取り込む場合は、ダウンロード URL をリポジトリ外の Secrets に置き、ブートストラップは manual workflow_dispatch + required approval step にする。
-
ダウンロード前に DUA/DUC 同意の確認を必須化する(Docs に合意済みの証跡を残す)。
-
実運用フロー(推奨):
- データの custodian にアクセス申請・DUA 同意を行う。
- 承認後、custodian から提供された安全なダウンロード URL(有効期限付き)またはアクセス用資格情報を CI シークレットに登録する。
scripts/bootstrap_connectome.py --download-urlを runner 上の protected step(manual approval がある workflow)で実行する。-
ダウンロードした JSON/NPZ は encrypted storage/ACL のついたアーティファクトリポジトリに保管し、公開リポジトリには含めない。
-
次の推奨作業(短期):
config/connectome_config.yamlの対象 dataset に上記フィールドを追加する(例を私がパッチで追加します)。- CI ワークフロー
bootstrap-connectome.ymlに manual approval / secrets 使用の注記を追加。
簡潔なパッチ(自動化希望なら適用します)。