Falcon(基盤モデル)に関するニュース一覧

Falcon(基盤モデル)に関するニュース一覧

TII、6億パラメータで画像認識の統合モデル「Falcon Perception」公開

単一モデルで高精度認識

画像とテキストを1つのTransformerで統合処理
SAM 3を上回るMacro-F1 68.0達成
属性・OCR・空間理解で大幅な性能差
0.6Bパラメータの軽量設計

OCRモデルも同時発表

Falcon OCRは0.3Bパラメータ
olmOCRベンチで80.3点の高精度
オープンソースOCR最高スループット

診断ベンチマークPBench

能力別にL0〜L4の5段階で評価
空間理解でSAM 3に+21.9点差

UAE・技術革新研究所(TII)Falconチームは2026年4月1日、画像認識・セグメンテーション・OCRを単一のTransformerで処理するオープンソースモデルFalcon Perception」を公開しました。パラメータ数はわずか6億で、従来のパイプライン型システムに代わる統合的なアプローチを提案しています。

Falcon Perceptionの最大の特徴は、画像パッチとテキストトークンを最初の層から同一のパラメータ空間で処理する「早期融合」アーキテクチャです。画像トークンには双方向注意、テキストトークンには因果的注意を適用するハイブリッドマスクにより、1つのモデルで視覚エンコーダとテキストデコーダの両方の役割を果たします。

オープン語彙セグメンテーションベンチマークSA-Coでは、Macro-F1で68.0を達成し、Meta社のSAM 3の62.3を上回りました。特に属性認識で+8.2、食品・飲料カテゴリで+12.2と大きな差をつけています。一方、存在判定の精度(MCC 0.64対0.82)ではSAM 3に及ばず、今後の改善課題として示されています。

同時に発表されたFalcon OCRは0.3Bパラメータの文書認識モデルです。olmOCRベンチマークで80.3点、OmniDocBenchで88.6点を記録し、DeepSeek OCR v2やGPT 5.2を上回る性能を示しました。オープンソースOCRモデルとして最高のスループットを実現し、vLLM統合によりA100上で毎秒2.9画像を処理できます。

チームは性能評価のため、能力別に分類した診断ベンチマークPBench」も公開しました。単純な物体認識(L0)から関係推論(L4)まで5段階に分かれ、Falcon Perceptionは空間理解でSAM 3に+21.9点、OCR識別で+13.4点と、プロンプトが複雑になるほど差が拡大する結果となっています。

学習には5400万枚の画像と1億9500万の正例表現、4億8800万のハードネガティブを使用しました。3段階の学習レシピにより、シーン理解からタスク特化、高密度シーン対応へと段階的に能力を獲得させています。モデルとコードはHugging Faceで公開されており、Apple Silicon向けのMLX統合やDockerサーバーも提供されています。

AIエージェント急増でSOC運用が限界、各社が防御策を競う

エージェント時代の新たな脅威

侵害の最速突破時間が27秒に短縮
企業端末で1800種のAIアプリを検出
OpenClawの公開インスタンスが50万件に急増
CEOの端末が闇市場で2.5万ドルで販売

主要ベンダーの対応策

CiscoがSplunk向け6種のAIエージェント発表
CrowdStrikeがパイプライン型検知を実装
Palo Altoがエージェント専用レジストリ構築

残された課題と対策

エージェント行動基準を出荷したベンダーなし
ゴーストエージェント棚卸しと無効化が急務

RSAC 2026において、CrowdStrike CEOのジョージ・カーツ氏は攻撃者の最速突破時間が27秒に短縮したと発表しました。企業端末では1800種以上のAIアプリケーションが稼働し、約1億6000万のインスタンスが検出されています。AIエージェントの急増がSOC運用に深刻な影響を与えている実態が明らかになりました。

Ciscoの調査では企業の85%がAIエージェントの試験導入を進めている一方、本番運用に移行できたのはわずか5%にとどまります。この80ポイントの差は、どのエージェントが稼働しているか、何を許可されているか、問題発生時の責任者は誰かといった基本的な問いにセキュリティチームが答えられないことに起因しています。

深刻な事例として、英国企業CEOのOpenClawインスタンスがBreachForumsで2万5000ドルで売りに出されました。AIアシスタントとの全会話履歴、本番データベース、APIキーなどが暗号化されずに平文で保存されていたためです。Cato Networksの調査ではOpenClawのインターネット公開インスタンスが約50万件に達し、うち1万5200件が既知の脆弱性で攻撃可能な状態です。

各ベンダーはRSAC 2026で対策を発表しました。CiscoはSplunk ES向けの6種のAIエージェントとオープンソースの防御フレームワーク「DefenseClaw」を公開。CrowdStrikeは買収したOnumの技術Falconに統合し、パイプライン段階でのリアルタイム検知を実現しました。Palo Alto NetworksはPrisma AIRS 3.0エージェント専用のレジストリと実行時監視を導入しています。

しかし、いずれのベンダーもエージェントの正常行動の基準値を提供していません。人間とエージェントの活動をログ上で区別できない環境が多く、正規の認証情報を持つ侵害済みエージェントがアラートを発生させずに動作する危険があります。OWASP Agentic Skills Top 10がClawHavocを主要事例として公開され、業界標準の整備が始まっています。

企業が直ちに取るべき対策として、全端末のAIエージェント棚卸し、OpenClawのローカルホスト限定設定、既知CVE3件への対応、不要なゴーストエージェントの無効化、そしてエージェントの行動基準策定が挙げられます。エージェントが生成するアラートへの対応速度が、今後90日間のSOC運用の成否を分けることになります。

Falcon H1R 7Bが7倍大きいモデルを超える推論性能を発揮

Falcon H1Rの技術的突破

TII発のFalcon H1R 7Bが最大7倍大きいモデルを凌駕
ハイブリッドアーキテクチャがパラメータ効率を極大化
70Bクラスのモデルと同等の推論ベンチマーク達成
主にオープンソースとして公開(一部制限あり)
アラビア語特化版Falcon-H1-Arabicも同時公開
小型高性能モデルの新しい基準を打ち立てる

小型推論モデルのパラダイム転換

より大きい=より賢い」神話を覆す
モデル蒸留・アーキテクチャ革新が限界を押し上げる
エッジデバイスでの高度推論が現実に
APIコストと推論速度で圧倒的優位を実現
アラビア語AIの不均衡是正に貢献
小型モデル競争(Phi・GemmaLlama-3)が激化

UAE・アブダビに拠点を置くTechnology Innovation Institute(TII)が発表したFalcon H1R 7Bは、わずか70億パラメータながら50B〜70Bクラスのモデルに匹敵する推論性能を達成した。この成果は「より大きなモデルがより賢い」という業界の常識を根本から覆す可能性を持つ。

性能の源泉はハイブリッドアーキテクチャにある。従来のTransformerとは異なる設計により、パラメータ当たりの情報密度が飛躍的に向上している。具体的な技術的詳細はまだ限定的に公開されているが、Mamba-Transformerの混合型に近い設計と見られている。

同時に発表されたFalcon-H1-Arabicは、アラビア語AIの能力向上に特化したモデルで、中東・北アフリカ地域での言語的AIアクセスの不均衡是正を目指している。英語中心のAI発展に対するバランスとして重要な取り組みだ。

実用上の意味は大きい。推論コストは概ねモデルサイズに比例するため、7Bモデルで70Bの性能が得られれば約10分の1のコストでサービスを運用できる。エッジデバイスへのデプロイも実用的な選択肢となり、オフラインAI処理の可能性が広がる。

小型高性能モデルの競争は、Microsoft Phi・Google GemmaMeta Llama-3・Mistralなど複数の有力モデルが参戦しており、エッジAI時代の主役を巡る争いが激化している。Falcon H1Rの登場はこの競争にさらなる刺激を加えるものだ。