HEALTH DATA COMPLIANCE

Health Data — 配布・利用制約を踏まえた設定ガイド

  • 要点(health.gov.au の観点):
  • 多くの公的医療データは用途・同意・匿名化要件や管理枠組みがある(例: HCP/PHDB/NIHSI/EDW)。
  • データ分類・ガバナンス(Data Governance Framework)があり、保管・共有・利用にポリシーが適用される。
  • 一部データは公開だが、研究利用や詳細アクセスは申請/承認・契約(DUA)を要する。

  • 設定で取り入れるべき項目(config/connectome_config.yaml に追加推奨):

  • access_type: "public" | "restricted" # 自動ダウンロード可否を判断
  • requires_approval: true/false
  • approval_contact: "email@custodian.gov.au" # 申請先
  • data_classification: "sensitive" | "public"
  • duc_required: true/false
  • duc_url: "https://..." # DUA/DUC の参照先
  • ci_download_secret: "CONNECTOME_DOWNLOAD_URL" # CI に置くシークレット名(制限データの場合は必須)
  • storage: { encrypted: true, allowed_environments: ["secure_cluster"] }
  • provenance: { source_url: ..., version: ..., contact: ... }

  • 例(sources 内の dataset エントリの拡張例):

hpd_restricted_dataset: dataset_id: "hpd_2024" source_url: "https://data.custodian.gov.au/hpd/metadata" format: "json" access_type: "restricted" requires_approval: true duc_required: true duc_url: "https://custodian.gov.au/duc" approval_contact: "data.custodian@agency.gov.au" data_classification: "sensitive" storage: encrypted: true allowed_environments: - "secure_cluster" ci_download_secret: "HPD_DOWNLOAD_URL"

  • CI と自動化の注意点:
  • access_type: restrictedrequires_approval: true の場合、自動で公開サイトから直接ダウンロードするワークフローは避ける。
  • CI で取り込む場合は、ダウンロード URL をリポジトリ外の Secrets に置き、ブートストラップは manual workflow_dispatch + required approval step にする。
  • ダウンロード前に DUA/DUC 同意の確認を必須化する(Docs に合意済みの証跡を残す)。

  • 実運用フロー(推奨):

  • データの custodian にアクセス申請・DUA 同意を行う。
  • 承認後、custodian から提供された安全なダウンロード URL(有効期限付き)またはアクセス用資格情報を CI シークレットに登録する。
  • scripts/bootstrap_connectome.py --download-url を runner 上の protected step(manual approval がある workflow)で実行する。
  • ダウンロードした JSON/NPZ は encrypted storage/ACL のついたアーティファクトリポジトリに保管し、公開リポジトリには含めない。

  • 次の推奨作業(短期):

  • config/connectome_config.yaml の対象 dataset に上記フィールドを追加する(例を私がパッチで追加します)。
  • CI ワークフロー bootstrap-connectome.yml に manual approval / secrets 使用の注記を追加。

簡潔なパッチ(自動化希望なら適用します)。