
A Whole New World
新しい世界を創る
Who We Are
次世代の安全で強力なAIを構築する。
私たちは、AIの最先端を切り拓く研究者、エンジニアからなるチームです。
モデル内部に隠された表現を理解し、評価し、守ります。
AIは錬金術ではない。AIは工学である。
AIを理解する・評価する・守る。
私たちの仕事は、3つの柱から成り立っています。基礎研究からプラットフォーム、運用防御までを一貫して提供することで、AI活用を推測(guesswork)ではなく工学(engineering)にします。
Understand
AIを理解する
モデル内部の意図表現・真実性・因果回路を可視化し、挙動の根拠を解明します。
LLM内部の意図表現を可視化する研究
モデル内に存在する「真実性」の方向を発見
推論回路のパスと影響度を解析する
Evaluate
AIを評価する
ホワイトボックス型評価基盤「AEGIS」と、攻撃シナリオを駆使したRed Teamで、モデルの潜在リスクを定量化します。
AEGIS — ホワイトボックス型モデル安全性評価基盤
潜在バイアスとサンドバギング(欺瞞)の検出
Jailbreak耐性の内部計測・定量化
Secure
AIを守る
解釈性を活用したガードレール基盤、LLM診断、ガバナンス設計を統合し、ミッションクリティカル領域でのAI活用を支えます。
Blog
All Blog
シン・機械学習:群論的対称性から圏論的対称性へ
知能、それは人類最大の武器であり特権であり謎でした。目まぐるしい技術発展の最高到達点として人類とは異なる知能が今まさに生み出されようとしています。そのインパクトは想像に難くないでしょう。 市場は既にAIをめぐる巨大なマネーゲームを始めています。その背景にはスケーリング則があります。データと計算リソー...

AIの解釈可能性が至上命題である
AIは時をかけるごとにどんどん発展していき、成長を続けている。 数年後には、モデルが圧倒的な力を持つようになるだろう。 私たち、人類はモデルが圧倒的な力を持ってしまう前に、AIシステムの動作を理解できるものとして、secure by designにしていかなくてはならないのだ。 badシナリオと...

LLMにおける線形表現仮説と特徴量幾何学の再現実験
Park 論文と Golechha ブログを軸に LLM の線形表現仮説と特徴量幾何学を 4 モデル(Gemma-2B, LLaMA-3-8B, Qwen3.5-2B, LLM-jp-4-8B)× 30 seed で再現。日本語 WordNet への拡張と Park の 70% 独立サブサンプル診断を独自に定量化し、near-zero cosine だけでは証拠不足だが、trained unembedding に残る構造を捉える Park の追加診断には依然として識別力があることを示す。
