Skip to content

Microsoft の軽量VLMのFlorence-2のColaboratory上でのサンプル

License

Notifications You must be signed in to change notification settings

Kazuhito00/Florence-2-Colaboratory-Sample

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Florence-2-Colaboratory-Sample

Microsoft の軽量VLMであるmicrosoft/Florence-2のColaboratory上でのサンプルです。

Usage

Open In Colab
Colaboratoryでノートブックを開き、上から順に実行してください。

Task

  • CAPTION:キャプション
  • DETAILED_CAPTION:詳細なキャプション
  • MORE_DETAILED_CAPTION:より詳細なキャプション
  • OD:物体検出
  • DENSE_REGION_CAPTION:高密度領域キャプション
  • REGION_PROPOSAL:領域提案
  • CAPTION_TO_PHRASE_GROUNDING:キャプションからフレーズへの接地
  • OPEN_VOCABULARY_DETECTION:オープンボキャブラリー物体検出
  • REFERRING_EXPRESSION_SEGMENTATION:参照セグメンテーション
  • REGION_TO_SEGMENTATION:領域指定セグメンテーション
  • REGION_TO_CATEGORY:領域→カテゴリー
  • REGION_TO_DESCRIPTION:領域→説明
  • OCR:単純OCR
  • OCR_WITH_REGION:領域検出OCR

Processing time reference

Google Colaboratory T4 GPU 上での処理時間計測結果(%%time使用)
1600x1066の画像を入力

タスク 処理時間目安
CAPTION CPU times: user 420 ms, sys: 1.1 ms, total: 421 ms
Wall time: 421 ms
DETAILED_CAPTION CPU times: user 978 ms, sys: 4.15 ms, total: 982 ms
Wall time: 981 ms
MORE_DETAILED_CAPTION CPU times: user 1.66 s, sys: 7.85 ms, total: 1.67 s
Wall time: 2.48 s
OD CPU times: user 2.3 s, sys: 7.84 ms, total: 2.31 s
Wall time: 2.3 s
DENSE_REGION_CAPTION CPU times: user 5.54 s, sys: 14.5 ms, total: 5.56 s
Wall time: 5.55 s
REGION_PROPOSAL CPU times: user 1.61 s, sys: 5.18 ms, total: 1.62 s
Wall time: 1.66 s
CAPTION_TO_PHRASE_GROUNDING CPU times: user 729 ms, sys: 2.96 ms, total: 732 ms
Wall time: 730 ms
OPEN_VOCABULARY_DETECTION CPU times: user 700 ms, sys: 962 µs, total: 701 ms
Wall time: 698 ms
REFERRING_EXPRESSION_SEGMENTATION CPU times: user 8.37 s, sys: 10.7 ms, total: 8.38 s
Wall time: 8.45 s
REGION_TO_SEGMENTATION CPU times: user 6.58 s, sys: 16.7 ms, total: 6.6 s
Wall time: 6.61 s
REGION_TO_CATEGORY CPU times: user 341 ms, sys: 52 µs, total: 341 ms
Wall time: 339 ms
REGION_TO_DESCRIPTION CPU times: user 426 ms, sys: 1.91 ms, total: 428 ms
Wall time: 424 ms
OCR CPU times: user 917 ms, sys: 22 µs, total: 917 ms
Wall time: 914 ms
OCR_WITH_REGION CPU times: user 2.99 s, sys: 10.5 ms, total: 3 s
Wall time: 3.09 s

Author

高橋かずひと(https://twitter.com/KzhtTkhs)

License

Florence-2-Colaboratory-Sample is under MIT License.

Note

サンプルの画像はぱくたそ様の「雨の都市風景、 横断歩道と歩行者」「パイクプレイスマーケットのエントランスとMediCleanseトラック」を使用しています。

About

Microsoft の軽量VLMのFlorence-2のColaboratory上でのサンプル

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published