Feiniu NAS AI フォトアルバムで使用されているモデル: 顔、オブジェクトの分解、セマンティック検索

Feiniu NAS (fnOS) の AI フォトアルバムは、一連のアルゴリズムを一から開発するのではなく、主流のオープンソースモデルに基づいてエンジニアリングを統合し、顔認識、シーン認識、自然言語画像検索を完成させます。

1) 顔認識: InsightFace

顔の機能に関しては、通常、コアは InsightFace です。

オブジェクト認識 (猫、犬、車、コンピューターなど) と写真内の部分的なシーンの理解は通常、YOLO シリーズ (通常は YOLOv8 または軽量バージョン) によって行われます。

Feiniu Photo Album は、「草の上の子犬」や「サングラスをかけた男性」など、自然言語を使用した写真の検索をサポートしています。

一般的な実装は CLIP です。

Feiniu AI フォトアルバムは、次の 3 層の組み合わせとして理解できます。

中核となる競争力は、基盤となるモデルをゼロからトレーニングするのではなく、主にエンジニアリングの統合、ローカリゼーション機能、ハードウェアアクセラレーションの最適化にあります。