AI とロボティクス ラウンドアップ:エージェントワークフロー、ローカル LLM、そしてヒューマノイド市場
AI とロボティクス ラウンドアップ:エージェントワークフロー、ローカル LLM、そしてヒューマノイド市場
自律エージェント群とツールの台頭
AI 開発は、単純なチャットボットから複雑なマルチステップ実行や専門的なセキュリティタスクをこなす自律的な「エージェント」ワークフローへとシフトしています。
- T3MP3ST Offensive Security Harness: Pliny the Liberator が T3MP3ST を導入しました。これは自律的な「ハックボット・ストライクフォース」で、Claude Code や Codex など既存のコーディングエージェント向けのレッドチームハーネスとして機能します。Web アプリ、ネットワークリコン、ソースコード監査をサポートし、XBEN ブラックボックスチャレンジスイートで 90.1% の pass@1、ホワイトボックスタスクで 98.7% を報告しています。単一エージェントとして、または MITRE ATT&CK フレームワークに基づく専門家群のスウォームとして動作できます [@elder_plinius]。
- Command Code Growth: Command Code は 15,000 人の有料顧客と 200 万ドルのランレートを達成しました。チームはランタイム非依存のハーネスコアを作るために v1 の書き直しを進めており、コードベースをオープンソース化する計画です [@MrAhmadAwais, @MrAhmadAwais]。
- Agent Orchestration Tools: エージェント管理を簡素化する新ツールが登場しています。たとえば CNVS は、クロスエージェントメモリシステムを用いて複数エージェント(例:Fable 5 が Cursor に委任)を視覚的にオーケストレーションできます [@_MaxBlade]。さらに、LangChain は OpenWiki をリリースしました。これはコードベース用のウィキを維持し、コーディングエージェントに長期的コンテキストを提供するオープンソースエージェントです [@minchoi]。
- Deployment and Integration: Anthropic は「Launch Your Agent」という Claude Code スキルを公開しました。ユーザーにインタビューしてスコープを定義し、クラウド上で自律エージェントを起動・スケジュールします [@cyrilXBT]。金融分野では、Injective MCP Server が AI エージェントにプレーンランゲージでオンチェーン永久先物取引を可能にしました [@injective]。
ローカル LLM の性能とインフラストラクチャ
コスト削減とプライバシー向上のために、高性能モデルをローカルで実行する動きが強まっており、量子化手法やハードウェア最適化がそれを支えています。
- GLM-5.2 とローカル実行: GLM-5.2 はフロンティアモデルの高性能代替として頻繁に取り上げられています。AMD MI355X 上で 2626 tok/s/node の速度で提供されており [@wafer_ai]、NVIDIA のビルドページでも入手可能です [@RoundtableSpace]。DGX Sparks と NVFP4 量子化を使用して高速デコードを実現しているユーザーもいます [@0xSero]。
- オープンモデルのコスト効率: DeepSeek v4 Flash や GLM-5.2 などのオープンソースモデルは、商用モデルに比べてトークン消費を最大 20 倍削減できると報告されています [@quxiaoyin]。ある開発者は DeepSeek V4 Flash (238B) が Qwen 3.6 35B A3B よりもはるかに安価に運用できると指摘しています [@jpschroeder]。
- ローカルハードウェア戦略: Mac Mini M4 に Ollama を導入することで、複数の ChatGPT Plus サブスクリプションを置き換えるコスト効果の高いソリューションとして注目されています [@doublenickk]。他のユーザーは Google Colab の無料 T4 GPU ティアを利用して Gemma 4 26B などのモデルを実行しています [@analogalok]。
具現化 AI とヒューマノイドロボティクス
ロボティクス分野では商業的関心が急増しており、汎用ヒューマノイドと高度な操作性を持つロボットに焦点が当たっています。
- 市場予測: Morgan Stanley は、ヒューマノイドロボットの世界総アドレス可能市場 (TAM) が 2050 年までに 7.5 兆ドルに達し、ロボット在庫は 10 億台に上ると予測しています [@pequityresearch]。
- 商業導入例: Agility Robotics の Digit は現在 Amazon のフルフィルメントセンターで稼働しており、18 か月以上にわたり安全インシデントはゼロです [@MelvinInvests]。Weave Robotics は Isaac 1 を発売しました。これは価格 7,999 ドルの車輪式ホームヘルパーで、洗濯や部屋のリセット作業に特化しています [@mikekalilmfg, @RoboHub]。
- 技術的焦点: 専門家は、次の大きなヒューマノイド競争は歩行能力ではなく、指先の器用さと壊れやすい物体を扱えるかどうかで決まると強調しています [@techniahq]。
フロンティアモデルのアップデートと研究
最新の報告書や学術論文は、フロンティアモデルの能力と限界の変遷を示しています。
- コンテキストウィンドウ: Google Gemini 3.5 Pro は 200 万トークンのコンテキストウィンドウでリリースされる噂があり、現在の Anthropic の最新モデルの 100 万トークン上限の倍となります [@astropol0]。
- 研究アイデアの範囲: Yale とシカゴ大学の論文は、LLM が生成する研究アイデアは質が高いものの、人間研究者が持つ「幅」には欠けており、別々の研究を結びつけることはできても多様な研究アプローチを提案することは少ないと指摘しています [@rohanpaul_ai]。
- モデル性能: Composio が GLM-5.2 を 41 のエージェントツール呼び出しタスクでテストした結果、完了率 97.6% を記録し、Claude Opus 4.8 や GPT-5.5 を上回りました [@composio]。
経済的・戦略的視点
- 「AI レイオフの罠」: Wharton School と Boston University の査読付き論文は、合理的な企業自動化が労働者を AI に置き換えることで消費者需要が減少し、経済が崩壊する可能性があると警告し、「ピグー的自動化税」の導入を提案しています [@jackcoder0]。
- エンタープライズ・データ主権: 企業は自社の「生産手段」(コンピュートとウェイト)を所有し、OpenAI や Anthropic などのフロンティアラボに独自知識が流出しないようにすべきだという警告が高まっています [@jawwwn_]。
- インフラ成長: JPMorgan の報告によると、LLM のトークンボリュームは前年同期比で 20 倍に増加し、H100 や B200 の GPU レンタル料金も上昇し続けており、AI の設備投資が鈍化しているという見方に反しています [@glocalinvestor]。
Summary
Recent developments highlight a shift toward autonomous agent swarms, the rise of high-performance local LLMs like GLM-5.2, and a projected $7.5 trillion humanoid robotics market by 2050.
Title
AI and Robotics Roundup: Agentic Workflows, Local LLMs, and the Humanoid Market