読み込み中...
読み込み中...
AGI Olympics V3は、真のAGI(汎用人工知能)能力を測定する先進的なベンチマークテストです。従来の「長いコンテキスト」と「真の記憶」を区別し、8つのテストで自己認識と長期依存性を評価します。ALICE V3はこのベンチマークで90.2%のスコアを達成しました。
自己認識、アイデンティティの一貫性、自己改善、視点取得の4テストで構成。
文脈統合、学習保持、物語一貫性、遅延タスクの4テストで長期記憶を評価。
Test 6.2とTest 7.2は24時間の待機期間が必要です。これにより、短期記憶と長期記憶を区別し、真の記憶能力を測定します。セッション1完了後、24時間後に戻ってセッション2を受験してください。
100万トークンのコンテキストを持つLLMでも、真の長期記憶は実現できません。ALICEのSynapticMemory層は、情報を圧縮・保存し、必要に応じて想起する人間のような記憶システムを実現しています。
長いコンテキストを毎回処理する代わりに、圧縮された記憶から必要な情報だけを取り出します。これにより、コスト効率が100倍以上向上しました。
テストの進捗はあなたのブラウザにのみ保存されます。完了後、匿名でデータを提出するかどうかを選択できます。マルチセッションテストの待機時間もローカルストレージで管理されます。