11.7 自己進化の高度化 - 理論的基盤と詳細設計

[!NOTE] 最新の実装状況は機能実装ステータス (Remaining Functionality) を参照してください。

Date: 2026-03-05
Author: Masahiro Aoki
Copyright: 2026 Moonlight Technologies Inc.
Status: 📅 計画中 → 実装設計フェーズ
関連ドキュメント: ADVANCED_EVOLUTION_PHASE5_6.md, EVOSPIKENET_CONCEPTS.md

概要

EvoSpikeNet の L5 自己進化レイヤーは、Phase 5（高度構造的突然変異）と Phase 6（協調進化）の実装をもとに、さらに上位の抽象レベルでの進化能力を達成する。本ドキュメントは 11.7 自己進化の高度化 を構成する4つのサブシステムの理論的基盤を詳述する。

1. メタ進化（Meta-Evolution）

1.1 定義と動機

メタ進化とは、進化アルゴリズム自体のパラメータ・構造・戦略が時間とともに進化する仕組みである。通常の進化（一次進化）がニューラルネットワークの重みや構造を最適化するのに対し、メタ進化は「どのように進化するか」そのものを学習・適応させる。

生物学的対応物として、有性生殖・組み換え頻度・突然変異率は長い進化的時間スケールで選択圧を受けている。高い突然変異率は探索空間を広げる一方で適応度の破壊を招き、低い突然変異率は局所最適に収束しやすい。メタ進化はこのトレードオフを動的に解決する。

1.2 理論的枠組み

1.2.1 二層進化モデル

\[ \text{進化}(\text{個体}) = f\left(\theta_{\text{evo}}\right) \]

\[ \text{メタ進化}(\theta_{\text{evo}}) = g\left(\theta_{\text{meta}}\right) \]

ここで: - \(\theta_{\text{evo}}\) = 進化パラメータ集合（突然変異率 \(\mu\)、交叉確率 \(p_c\)、選択圧 \(k\)） - \(\theta_{\text{meta}}\) = メタパラメータ集合（適応速度、探索/活用バランス）

1.2.2 適応的突然変異率理論

自己適応型進化戦略（Self-Adaptive ES）では突然変異率 \(\sigma\) をゲノムに組み込み、個体とともに進化させる：

\[ \sigma' = \sigma \cdot \exp\left(\tau' \cdot \mathcal{N}(0,1) + \tau \cdot \mathcal{N}_i(0,1)\right) \]

\[ x' = x + \sigma' \cdot \mathcal{N}(0, \mathbf{I}) \]

ここで \(\tau' = 1/\sqrt{2n}\)、\(\tau = 1/\sqrt{2\sqrt{n}}\)（\(n\) = 問題次元）。

1.2.3 進化アルゴリズムのゲノム表現

EvoSpikeNet では EvoGenome の global_config に進化パラメータを組み込む拡張を行う：

@dataclass
class MetaEvolutionConfig:
    """メタ進化パラメータ（ゲノムの一部として進化する）"""
    mutation_rate: float          # 基本突然変異率 μ ∈ [0.001, 0.5]
    crossover_rate: float         # 交叉確率 p_c ∈ [0.0, 1.0]
    selection_pressure: float     # 選択圧 k ∈ [1.0, 10.0]
    population_sampling: str      # "tournament" | "roulette" | "rank"
    elitism_ratio: float          # エリート保存割合 ∈ [0.0, 0.3]
    repair_strategy: str          # "none" | "clamp" | "reflect"

    # メタパラメータ自体の適応係数
    meta_lr: float = 0.01
    meta_sigma: float = 0.1

1.2.4 メタ適応度関数

メタ進化における個体の適応度は、その進化戦略が生成した子孫の平均適応度で評価される：

\[ F_{\text{meta}}(\theta_{\text{evo}}) = \mathbb{E}_{g \sim P(\theta_{\text{evo}})}\left[F_{\text{task}}(g)\right] \]

これにより「良い子孫を生む」進化戦略が選択される。

1.3 EvoSpikeNet における具体的機構

1.3.1 自己適応型突然変異エンジン

AdvancedMutationEngine（advanced_mutations.py）の AdaptiveMutationConfig を拡張し：

成功履歴ベース適応: 直近 \(N\) 世代での突然変異タイプ別成功率から各タイプの確率を更新
\(p_{m,t+1} = p_{m,t} + \alpha \cdot (\text{成功率}_t - \bar{p}_t)\)
1/5成功則（1/5-Rule）: Rechenberg(1973) の成功則に従い、成功確率が \(1/5\) を超えれば \(\sigma\) を増加、下回れば減少

1.3.2 交叉戦略の進化

交叉タイプ	遺伝子表現	有効場面
一点交叉	`crossover_type=1`	単純な連続パラメータ
二点交叉	`crossover_type=2`	モジュール境界の保護
均一交叉	`crossover_type=uniform`	遺伝子間独立性が高い場合
算術交叉	`crossover_type=arithmetic`	連続値最適化
サブゲノム交叉	`crossover_type=subgenome`	染色体単位の組み換え

交叉タイプ自体もゲノムに記録され、メタ進化の対象となる。

1.3.3 選択メカニズムの動的切り替え

環境の変動性（フィットネスランドスケープの非定常性）を検出し選択戦略を切り替える：

検出：fitness_variance の急増 → 探索強化 (σ 増加、selection_pressure 低減)
検出：fitness_plateau (連続 k 世代改善なし) → 活用強化 (elitism_ratio 増加)
検出：diversity_collapse (species 数 < threshold) → 多様性回復 (mutation_rate 増加)

1.4 理論的保証と限界

収束理論: No Free Lunch 定理 (Wolpert & Macready, 1997) から、メタ進化も特定問題クラスに特化する。汎用メタ進化は不可能。
計算コスト: メタ進化の評価はオブジェクト進化より \(O(N_{\text{gen}})\) 倍のコストを要する。
オーバーフィッティング: メタパラメータが特定タスクに過適合するリスク → 定期的な多様化が必要。

2. 階層的進化（Hierarchical Evolution）

2.1 定義と動機

階層的進化とは、異なる時間スケール・抽象レベルで同時並行的に適応が起こる仕組みである。進化速度の遅い「高レベル」変化（モジュール構造、連結性パターン）と速い「低レベル」変化（シナプス重み、スパイク閾値）を組み合わせ、安定性と適応性を両立する。

生物的対応: 大脳皮質の階層的情報処理（V1→V2→V4→IT の視覚階層）と学習速度の違いに対応。

2.2 理論的枠組み

2.2.1 時間スケール分離理論

進化を複数のタイムスケールで分離する（Maclean & Tononi, 2019 の意識理論との対応）：

レベル	変化の対象	タイムスケール	実装
L0（反射）	スパイク閾値、即時応答	ms〜s	STDP, Homeostasis
L1（学習）	シナプス重み、可塑性係数	s〜分	Plasticity rules
L2（発達）	ネットワーク構造、層サイズ	分〜時間	AdvancedMutationEngine
L3（進化）	モジュール接続、ゲノム構造	時間〜日	EvolutionEngine
L4（メタ進化）	進化戦略パラメータ	日〜週	MetaEvolution

2.2.2 階層間信号伝達

上位レベルが下位レベルへの「制約」を設定し、下位レベルの適応結果が上位レベルへ「フィードバック」される：

\[ \text{constraint}_{L_i \to L_{i-1}} = h_i(\text{state}_{L_i}) \]

\[ \text{feedback}_{L_{i-1} \to L_i} = \nabla_{L_i} F(\text{perf}_{L_{i-1}}) \]

2.2.3 階層的ゲノム表現

現在の EvoGenome は平坦な Chromosome 構造を持つ。階層的進化では染色体を階層化する：

EvoGenome
├── MetaChromosome        (L4: メタ進化戦略)
│   └── EvoStrategyGenes
├── MacroChromosome       (L3: モジュール間接続)
│   └── ConnectivityGenes
├── MesoChromosome[]      (L2: 各モジュール構造)
│   ├── LayerStructureGenes
│   └── TopologyGenes
└── MicroChromosome[]     (L1: シナプス可塑性)
    └── PlasticityGenes

2.2.4 進化速度の動的調整

各レベルの進化速度 \(v_i\) は適応度勾配の大きさで自動調整：

\[ v_i(t) = v_{i,\text{base}} \cdot \left(1 + \beta \cdot \left|\frac{\partial F}{\partial \theta_i}\right|\right) \]

大きな適応度勾配：そのレベルの変化が有効 → 速度増加
小さな適応度勾配：そのレベルは飽和 → 速度減少により計算リソース節約

2.2.5 Baldwin 効果の活用

学習（可塑性）が遺伝的進化を方向付ける「Baldwin 効果」を実装：

個体が短時間の学習によって環境適応
学習の終点付近のパラメータ値を「遺伝的同化」のターゲットとして使用
遺伝子レベルでの最適化を学習済みパラメータ空間に向ける

2.3 EvoSpikeNet における具体的機構

2.3.1 可塑性階層との統合

既存の hierarchical_plasticity.py をベースに進化レイヤーと統合：

HierarchicalPlasticityController の各レベル学習率を EvoGenome の遺伝子として登録
可塑性ルールの性能指標（収束速度、安定性）を上位進化レベルへフィードバック

2.3.2 モジュール接続の進化

Chromosome の network_topology の connection_matrix をモジュール間に拡張し：

マクロ接続行列: モジュール（PFC、Memory、Vision）間の情報フロー
ミクロ接続行列: モジュール内の層間接続
両レベルを独立した進化速度で最適化

2.3.3 脳領域ロールモデル

分散脳の 24 ノード構成に対応した階層的役割：

抽象レベル高 ─── PFC/Executive ノード群 (意思決定・進化戦略制御)
                    │
             ロール割り当て信号
                    ↓
             統合ノード群 (SpatialIntegration, LanMain)
                    │
             特徴圧縮信号
                    ↓
抽象レベル低 ─── 感覚ノード群 (Vision, Audio, Tactile)

3. 協調進化の拡張（Extended Cooperative Co-evolution）

3.1 定義と動機

既存の Phase 6 協調進化（coevolution.py）は 2〜数個体群間の競争/協調を扱う。拡張協調進化は以下を追加する：

非対称協調: 役割の異なる専門化個体群の協力
コミュニケーション進化: 個体群間のシグナル方式自体を進化
文化的進化: 学習された行動が集団内で伝播する機構
生態系ダイナミクス: 複数のニッチが相互依存するエコシステム形成

3.2 理論的枠組み

3.2.1 協調共進化の形式的定義

\(K\) 個の個体群 \(\{P_1, \ldots, P_K\}\) が存在し、各個体 \(g_i^{(k)}\) の適応度が他個体群の代表個体との相互作用で定まる：

\[ F_k(g_i^{(k)}) = f_k\left(g_i^{(k)}, \text{context}_{-k}\right) \]

ここで \(\text{context}_{-k} = \{r^{(j)} : j \neq k\}\)（他個体群の代表個体集合）。

3.2.2 役割特化理論（Role Specialization）

チーム内での役割分担が創発する条件：

相補性条件: 個体 \(a\) が得意タスクで個体 \(b\) が不得意、逆も成立するとき、組み合わせ適応度が単独より高い：

\[ F_{\text{team}}(a, b) > \max\left(F(a, a), F(b, b)\right) \]

役割安定性: Nash 均衡条件 — どの個体も単独で役割を変えても改善不可：

\[ F_k(g_k^*, \mathbf{g}_{-k}^*) \geq F_k(g, \mathbf{g}_{-k}^*) \quad \forall g \in P_k \]

3.2.3 コミュニケーション進化の理論

Shannon の情報理論に基づくコミュニケーション進化：

信号次元: \(d_{\text{signal}}\) 次元のコミュニケーションチャネル
送信者適応度: 受信者の行動変化から計算
受信者適応度: 信号を解釈して得られるタスク性能

信号の進化により最終的に「意味のある言語」が創発する（Nowak & Krakauer, 1999 の言語進化モデルに類似）。

\[ \text{語彙獲得速度} \propto \exp\left(-d_H(s, s') / T\right) \]

ここで \(d_H\) はハミング距離、\(T\) は「温度」パラメータ。

3.2.4 文化的進化メカニズム（Meme 伝播）

個体群内の優良解が「文化」として伝播する：

模倣学習: 適応度上位個体の戦略を確率的にコピー
ミーム変異: コピー時の模倣誤差による多様性維持
文化的選択: 集団レベルで有利なミームが普及

\[ P(\text{meme}_i \to \text{meme}_j) = \frac{F_j}{\sum_k F_k} \cdot (1 - \epsilon) + \epsilon \cdot \mathcal{U} \]

3.2.5 生態系進化ダイナミクス

Lotka-Volterra 方程式の拡張による複数個体群共存モデル：

\[ \frac{dN_i}{dt} = r_i N_i \left(1 - \frac{\sum_j \alpha_{ij} N_j}{K_i}\right) \]

ここで: - \(N_i\): 個体群 \(i\) のサイズ - \(r_i\): 内在的成長率（= 進化速度） - \(K_i\): 環境収容力（= リソース制限） - \(\alpha_{ij}\): 個体群間相互作用行列（競争/協調の強度）

3.3 EvoSpikeNet における具体的機構

3.3.1 既存 CoevolutionEngine の拡張点

現在の CoevolutionEngine（coevolution.py）に対する追加機能：

既存機能	拡張内容
`competitive_evaluation`	非対称競争・環境変動への対応
`cooperative_evaluation`	役割特化メカニズムの追加
`speciate_population`	生態的ニッチ共存モデルの追加
固定チームサイズ	動的チーム形成・解散

3.3.2 専門化個体群アーキテクチャ

EvoSpikeNet の分散ノードに対応した専門化個体群：

個体群アーキテクチャ:
┌─────────────────────────────────────────────────┐
│  P_Executive: 高次意思決定戦略の進化              │
│  P_Memory: 記憶アクセスパターンの進化             │
│  P_Perception: 感覚処理効率の進化                │
│  P_Motor: 運動制御戦略の進化                     │
│  P_Communication: ノード間通信プロトコルの進化    │
└─────────────────────────────────────────────────┘
      ↕ 適応度依存相互作用（役割補完性を最大化）

3.3.3 コミュニケーションプロトコル進化

Zenoh ベースのメッセージ形式を進化変数として扱う：

メッセージ圧縮レベル: 精度 vs レイテンシのトレードオフ最適化
送信頻度: バースト vs 定常の動的切り替え
優先度マッピング: タスク重要度に応じたメッセージ優先度の自動調整

3.3.4 集合知メカニズム

Stigmergy（間接協調）の実装：

個体群が「フェロモン」として環境（ゲノムプール）に痕跡を残す
成功した遺伝子パターンが「ホットスポット」として記録される
他個体がホットスポット周辺を優先的に探索

4. 進化戦略の適応（Adaptive Evolution Strategies）

4.1 定義と動機

進化戦略の適応とは、外部環境の変化に応じてリアルタイムで進化パラメータ（突然変異率、選択手法、個体群サイズ等）を調整する仕組みである。

固定パラメータの進化戦略は定常環境では機能するが、実世界の非定常環境（センサーノイズ変化、タスク要求変化、ハードウェア性能変動）では性能が急落する。

4.2 理論的枠組み

4.2.1 環境変動検出理論

CUSUM（累積和）検定による環境変化点検出：

\[ S_t = \max\left(0, S_{t-1} + (x_t - \mu_0) - k\right) \]

閾値 \(h\) を超えたとき変化点を検出し、進化戦略の再適応をトリガーする。

適応度ランドスケープの曲率による安定性評価：

\[ \kappa = \frac{\partial^2 F}{\partial \theta^2}\bigg|_{\theta^*} \]

\(\kappa < 0\)（凸）: 安定的最適解 → 活用（Exploitation）増加
\(\kappa > 0\)（凹）: 不安定な局所最適 → 探索（Exploration）増加

4.2.2 探索-活用バランスの動的調整

UCB（Upper Confidence Bound）型バランス制御：

\[ \text{Exploration\_bias}(t) = C \cdot \sqrt{\frac{\ln t}{n_{\text{exploit}}(t)}} \]

ε-greedy の動的スケジューリング：

\[ \epsilon(t) = \epsilon_{\min} + (\epsilon_{\max} - \epsilon_{\min}) \cdot e^{-\lambda t} \]

ただし環境変化検出時はε をリセット：\(\epsilon(t_{\text{change}}) = \epsilon_{\max}\)

4.2.3 CMA-ES（共分散行列適応進化戦略）

高次元パラメータ空間での効率的探索のために CMA-ES を採用：

\[ \mathbf{x}^{(g+1)}_k = \mathbf{m}^{(g)} + \sigma^{(g)} \mathcal{N}(\mathbf{0}, \mathbf{C}^{(g)}) \]

\(\mathbf{m}\): 分布の平均（現在の最良推定値）
\(\sigma\): ステップサイズ（全体的な探索範囲）
\(\mathbf{C}\): 共分散行列（探索方向の学習）

共分散行列の更新（進化の「方向」を学習）：

\[ \mathbf{C}^{(g+1)} = (1-c_1-c_\mu)\mathbf{C}^{(g)} + c_1 \mathbf{p}_c \mathbf{p}_c^T + c_\mu \sum_{i=1}^{\mu} w_i \mathbf{y}_{i:\lambda} \mathbf{y}_{i:\lambda}^T \]

4.2.4 大域的適応と局所的適応の階層制御

島モデル（Island Model）との組み合わせ：

各島（個体群）が独立した進化戦略パラメータを持つ
定期的な移住（Migration）で効果的な戦略が伝播
島間多様性が維持されつつグローバル最適化が進む

\[ P_{\text{migrate}}(i \to j) = \sigma\left(\beta \cdot \Delta F_{ij}\right) \]

ここで \(\Delta F_{ij} = \bar{F}_j - \bar{F}_i\)（適応度差による移住促進）。

4.2.5 強化学習との統合（CEM + RL）

プログレス設定システム（progress_config.py との連携）：

Cross-Entropy Method (CEM) を使った進化戦略の強化学習的最適化：

進化戦略パラメータ空間 \(\Theta\) で確率分布 \(p(\theta; \mu, \sigma)\) を初期化
\(N\) サンプルの \(\theta\) でエピソードを実行し適応度評価
上位 \(N_e\) エリートから \(\mu, \sigma\) を更新
環境特性ベクトル \(\mathbf{e}\) を条件とした条件付き分布 \(p(\theta | \mathbf{e})\) に拡張

4.3 EvoSpikeNet における具体的機構

4.3.1 環境センサー統合

進化戦略の適応に使用する環境信号：

環境信号	データソース	更新頻度	影響する戦略パラメータ
タスク性能変化	`fitness_evaluator.py`	毎世代	突然変異率、選択圧
エネルギー使用率	`energy_tracker.py`	リアルタイム	個体群サイズ、評価頻度
ノード障害率	`auto_recovery.py`	リアルタイム	ロバスト性重み
入力分布シフト	`dataloaders.py`	バッチ毎	多様性圧力
ネットワーク遅延	`zenoh_comm.py`	リアルタイム	分散評価頻度
メモリ圧力	`memory_monitor.py`	定期	個体群サイズ上限

4.3.2 進化パラメータコントローラ

evolution_engine.py の MutationEngine を拡張した適応型コントローラ：

class AdaptiveStrategyController:
    """環境変化に応答して進化戦略を自動調整"""

    def __init__(self, base_config: EvolutionConfig):
        self.current_params = base_config
        self.environment_monitor = EnvironmentMonitor()
        self.history = RollingBuffer(window=50)
        self.change_detector = CUSUMDetector(threshold=5.0)

    def adapt(self, fitness_signal: float, env_state: EnvState):
        """フィットネス信号と環境状態から進化パラメータを更新"""
        self.history.push(fitness_signal)

        if self.change_detector.detect(fitness_signal):
            self._reset_exploration()  # εリセット

        gradient = self._estimate_fitness_gradient()
        self._update_params(gradient, env_state)

    def _update_params(self, gradient: float, env: EnvState):
        if abs(gradient) < self.plateau_threshold:
            # 停滞状態 → 探索強化
            self.current_params.mutation_rate *= 1.5
            self.current_params.diversity_pressure += 0.1
        else:
            # 改善中 → 活用強化
            self.current_params.elitism_ratio += 0.05
            self.current_params.mutation_rate *= 0.9

4.3.3 進化パラメータとハードウェア適応

クラスタ構成変化（ノード追加/削除）への対応：

ノード数増加 → 個体群サイズ比例増加、島数増加
ノード障害 → 影響個体群のバックアップからの復元
GPU/CPU 切り替え → 評価バッチサイズの自動調整

5. 4サブシステムの統合アーキテクチャ

5.1 統合モデル図

┌─────────────────────────────────────────────────────────────────┐
│                    11.7 自己進化の高度化                          │
│                                                                   │
│  ┌─────────────┐  フィードバック  ┌─────────────────────────┐   │
│  │ メタ進化    │ ←──────────── │  進化戦略の適応          │   │
│  │ (L4)        │ ──────────→  │  (环境センサー統合)       │   │
│  └──────┬──────┘  戦略制御     └──────────┬──────────────┘   │
│         │ 制約/フィードバック              │ パラメータ調整    │
│         ↓                                 ↓                     │
│  ┌─────────────┐               ┌─────────────────────────┐   │
│  │ 階層的進化  │ ←────────── │  協調進化の拡張          │   │
│  │ (多時間スケ │   個体群間    │  (役割特化+文化的進化)   │   │
│  │  ール)      │   シグナル    │                          │   │
│  └──────┬──────┘               └──────────┬──────────────┘   │
│         │                                 │                     │
│         └──────────┬──────────────────────┘                    │
│                    ↓                                             │
│          ┌─────────────────┐                                    │
│          │ EvoGenome       │                                    │
│          │ (Phase 5/6 基盤) │                                    │
│          └─────────────────┘                                    │
└─────────────────────────────────────────────────────────────────┘

5.2 信号フローの優先順位

優先度	信号	発信元	受信先	トリガー条件
最高	安全違反アラート	`safety_filter.py`	全進化システム	即時停止
高	環境急変シグナル	`change_detector`	進化戦略の適応	CUSUM閾値超え
中	多様性崩壊警告	`CoevolutionEngine`	メタ進化	species数 < 3
低	性能停滞通知	`EvolutionEngine`	階層的進化	10世代改善なし

5.3 計算複雑度の整理

サブシステム	時間複雑度	空間複雑度	並列化可能性
メタ進化	\(O(G \cdot N \cdot F_{\text{eval}})\)	\(O(N + \\|Θ\\|)\)	世代間は不可、個体間は可
階層的進化	\(O(L \cdot N \cdot F_{\text{eval}})\)	\(O(L \cdot N)\)	レベル間は逐次、個体間は可
協調進化拡張	\(O(K^2 \cdot N^2)\)（種分化時）	\(O(K \cdot N)\)	個体群間は可
進化戦略適応	\(O(W \cdot D^2)\)（CMA-ES）	\(O(D^2)\)	評価は並列可

6. 先行研究との対応

概念	先行研究	EvoSpikeNet での実装
メタ進化	CMA-ES (Hansen, 2001), MAML (Finn et al., 2017)	`MetaEvolutionConfig` 拡張
階層的進化	HyperNEAT (Stanley & Miikkulainen), NEAT	`HierarchicalGenome` 構造
協調共進化	CCEA (Potter & Jong, 1994), NSGA-II	`CoevolutionEngine` 拡張
文化的進化	MemeticAlgorithms (Moscato, 1989)	`MemeticPropagation` 実装
Baldwin 効果	Hinton & Nowlan (1987)	`GeneticAssimilation` モジュール
進化戦略適応	IPOP-CMA-ES, 自己適応 ES	`AdaptiveStrategyController`

7. EvoSpikeNet 既存アーキテクチャとの統合ポイント

7.1 既存ファイルへの拡張

既存ファイル	拡張内容
`evospikenet/genome.py`	`MetaEvolutionConfig`, `HierarchicalChromosome` データクラス追加
`evospikenet/evolution_engine.py`	`MetaEvolutionEngine`, `AdaptiveStrategyController` クラス追加
`evospikenet/advanced_mutations.py`	`AdaptiveMutationConfig` のメタ進化対応拡張
`evospikenet/coevolution.py`	`ExtendedCoevolutionEngine`, `CommunicationEvolutionEngine` 追加
`evospikenet/genome_pool.py`	階層的個体群管理、生態系ダイナミクスサポート追加

7.2 新規ファイル

ファイル	役割
`evospikenet/meta_evolution.py`	メタ進化エンジン本体
`evospikenet/hierarchical_evolution.py`	階層的進化コントローラ
`evospikenet/evolution_strategy_adapter.py`	進化戦略適応コントローラ
`evospikenet/memetic_evolution.py`	文化的進化・ミーム伝播
`evospikenet/ecosystem_dynamics.py`	生態系動態シミュレーション

8. 参考文献

Hansen, N. & Ostermeier, A. (2001). Completely Derandomized Self-Adaptation in Evolution Strategies. Evolutionary Computation, 9(2).
Finn, C., Abbeel, P., & Levine, S. (2017). Model-Agnostic Meta-Learning for Fast Adaptation. ICML 2017.
Potter, M.A. & De Jong, K.A. (1994). A Cooperative Coevolutionary Approach to Function Optimization. PPSN III.
Moscato, P. (1989). On Evolution, Search, Optimization, Genetic Algorithms and Martial Arts: Towards Memetic Algorithms. Caltech Memo.
Stanley, K.O. & Miikkulainen, R. (2002). Evolving Neural Networks through Augmenting Topologies. Evolutionary Computation, 10(2).
Hinton, G.E. & Nowlan, S.J. (1987). How Learning Can Guide Evolution. Complex Systems, 1(3).
Wolpert, D.H. & Macready, W.G. (1997). No Free Lunch Theorems for Optimization. IEEE Trans. Evol. Comput., 1(1).
Nowak, M.A. & Krakauer, D.C. (1999). The Evolution of Language. PNAS, 96(14).
Rechenberg, I. (1973). Evolutionsstrategie. Frommann-Holzboog.
Baldwin, J.M. (1896). A New Factor in Evolution. American Naturalist, 30.