AIエージェントがコマンドラインでブラウザを自動操作できる「Browser Use CLI 2.0」リリース。Chrome DevToolsへの接続などで操作速度が2倍に
人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPythonライブラリ「Browser Use CLI 2.0」がリリースされました。
Browser Use CLI 2.0では、Chromeブラウザに対してChrome DevTools Protocol(CDP)で接続して操作できるようになり、またセッションごとにWebブラウザを起動することなくデーモンによるセッションの保持が行われることで、前バージョンよりも操作速度が2倍になるなどの機能向上が実現されています。
Introducing: Browser Use CLI 2.0
— Browser Use (@browser_use) March 20, 2026
The most efficient browser automation CLI tool
> 2x the speed, half the cost
> Easily connect to running Chrome
> Uses direct CDP
Try it now ?↓ pic.twitter.com/9YZ2oB5wVz
Browser Use CLI 2.0は、AIエージェントによるWebブラウザの操作自動化を実現するオープンソースの「Browser Use」の一部として、コマンドラインから操作する機能を備えたソフトウェアです。
一般に、コードやコマンドを用いたWebブラウザの自動操作は、操作対象となるWebサイトのURL、表示された画面上のボタンやフィールドを操作するためのDOMの指定や名称などを、ひとつひとつ正確に指示しなければなりません。
しかしBrowser UseおよびBrowser Use CLIでは、人間やAIエージェントがおおまかな指示を与えるだけで、Browser Useに組み込んだAIがその意図を読み取り、適切なURLやボタンなどを操作してくれる、というものです。
操作対象のWebブラウザとして、ユーザーが利用しているChrome、ヘッドレスのChromium、有償で提供しているBrowser Use Cloud API経由でのクラウドベースのWebブラウザが利用可能で、既存のユーザープロファイルを利用してWebサイトへのログインが可能。
有償のBrowser Use Cloudには、ボットを判別するキャプチャの突破機能などが備わっています。
Browser Use CLI 2.0ではChrome DevTools Protocol(CDP)での接続、最初のコマンドでデーモンが起動し、Webブラウザとのセッションを保持することでセッションごとにWebブラウザを起動することなくコマンドを実行できるようになったことなどにより、コマンドに対して50ミリ秒以下で操作が行われる高速なレスポンスを実現していると説明されています。
利用可能なAIモデルはGoogle Gemini、OpenAI GPT、Anthropic Claude、Azure OpenAIなどの他に、Responses APIにも対応。ローカルで実行しているLLMも利用可能です。
コマンドラインからの指示でブラウザを自動操作
以下は公開されたデモ動画のキャプチャです。
Brouser Use CLI 2.0を起動し、「x.com」に接続せよと指示。

Webブラウザでは、Devtoolsが外部と接続してよいかどうかの許可を求めてきたため、Allow(許可)ボタンをクリック。

するとx.comが表示される。

Browser Use CLIから、「What are my most recent notifs」(最近の通知を教えて)と指示。

x.comの「Notifications」のページへ遷移。

Browser Use CLIがこれを読み取り、コマンドラインに最近の通知の一覧が返ってくる。

あわせて読みたい
「Google AI Studio」がFirebaseのバックエンドとAntigravityのコーディングエージェントを搭載、プロンプトだけで高度なフルスタックアプリケーションを生成可能に
≪前の記事
Node.js互換でコンテナよりも高密度と高速起動を実現する「Edge.js」、Wasmerが発表
