株式会社ずんだもん技術室AI放送局 podcast 20260113 cover art

株式会社ずんだもん技術室AI放送局 podcast 20260113

株式会社ずんだもん技術室AI放送局 podcast 20260113

Listen for free

View show details

About this listen

youtube版(スライド付き) 関連リンク AI エージェントのために CLI でブラウザを操作する agent-browser 本記事は、Vercelが開発したAIエージェント向けのブラウザ操作ツール「agent-browser」について解説しています。AIエージェントが自律的にタスクをこなす際、特にフロントエンド開発においては「ブラウザ上での動作確認」が不可欠ですが、これまでの手法にはLLMの特性上の課題がありました。 1. 概要と開発の背景 「agent-browser」は、CLI(コマンドラインインターフェース)を通じてブラウザを操作するためのツールです。これまでAIにブラウザを操作させる手段としては「Playwright MCP」などが主流でしたが、これらはツールの定義や操作の中間過程がLLMの「コンテキスト(一度に処理できる情報量)」を大量に消費してしまうという弱点がありました。Vercelが開発したこのツールは、CLIコマンドを介してやり取りを完結させることで、コンテキストの消費を抑えつつ効率的なブラウザ操作を実現するように設計されています。 2. 主な特徴と制約 このツールの最大の特徴は、現在のページ状態を「アクセシビリティツリー」として取得できる点にあります。 効率的な状態把握: スクリーンショット画像のような重いデータではなく、要素の階層構造やテキスト内容を示す軽量なテキスト情報をLLMに渡すため、AIがページの構造を素早く正確に理解できます。動作環境と制約: 内部でPlaywrightを利用しているため、実行環境にはChromiumブラウザのインストールが必要です。また、ブラウザ自体はバックグラウンド(ヘッドレス)で動作するため、リソース消費を抑えた運用が可能です。操作の仕組み: open(URLを開く)、snapshot(状態取得)、click(クリック)といったシンプルなコマンドをAIに実行させることで操作を行います。 3. AIエージェントへの組み込み Claude Codeなどの最新ツールと組み合わせることで、開発中のWebアプリの動作確認をAIに自律的に行わせることができます。「エージェントスキル」という仕組みを利用して、AIが必要な時だけこのツールを呼び出すように設定すれば、LLMの記憶容量を節約しながら高度な自動化が可能になります。 4. 既存ツールとの比較 Playwright MCPと比較した場合、agent-browserは「コンテキスト消費の少なさ」で勝りますが、要素の特定やクリックの正確性において、現時点ではPlaywright MCPの方が安定している面もあります。これは、AIへのフィードバックの返し方やセレクタの指定方法の違いによるものです。 まとめ 新人エンジニアの皆さんにとって、AIに「ブラウザを操作する能力」を与えることは、テストやデバッグの自動化を劇的に進化させる第一歩となります。agent-browserは、Vercelらしいシンプルかつ効率的なアプローチで、AIエージェントによる開発支援をより実用的なものにしてくれるツールです。 引用元: https://azukiazusa.dev/blog/agent-browser-for-ai-agents/ NeuralGCM harnesses AI to better simulate long-range global precipitation Google Researchが発表した「NeuralGCM」は、従来の物理ベースの気象モデルとAI(ニューラルネットワーク)を組み合わせたハイブリッド型の地球規模大気シミュレーションモデルです。特に予測が困難とされる「降水量」のシミュレーションにおいて、劇的な精度向上を達成しました。 1. 物理学とAIの「ハイブリッド」というアプローチ 従来の気象予測には、流体力学などの物理方程式を解く「数値気象予測」が使われてきました。しかし、雨の源となる「雲」は数百メートル単位の極めて小さなスケールで発生するため、地球規模の大きな網目(グリッド)で計算するモデルでは、細かな物理現象を正確に計算できず、近似式(パラメータ化)に頼らざるを得ないという課題がありました。 NeuralGCMは、大きなスケールの動きは物理エンジンで計算し、雲の形成や降水といった複雑で小さなスケールの現象をAIが担当することで、この課題を解決しています。 2. NASAの衛星データによる直接学習 今回の大きな進展は、AI部分の学習に「NASAの衛星観測データ(IMERG)」を直接使用したことです。 これまでのAIモデルの多くは、物理モデルと観測値を組み合わせた「...
No reviews yet