Milestone bemutatja vizuális nyelvi modelljét

A Milestone Systems, piacra dobott egy fejlett vizuális nyelvi modellt (VLM), amely a forgalom megértésére specializálódott és amelyet az Nvidia Cosmos Reason működtet.

Forrás: Milestone Systems

Az Nvidia Cosmos Reason az NVIDIA Cosmos csomagjának része – egy világmodell-család, amelynek célja, hogy segítsen a mesterséges intelligencia rendszereknek megérteni és interakcióba lépni a fizikai világgal (robotok, önvezető járművek, videóanalitika stb.). Egy multimodális érvelési modellről van szó, amely a látással és a nyelvvel együttműködve értelmezi és reagál a valós adatokra, például videókra és képekre. (Open AI)

A VLM két új terméket működtet: egy videós összefoglaló eszközt az Xprotect Video Management Software-hez és egy VLM as a Service-t harmadik féltől származó integrációkhoz. Az Xprotect fejlesztése lehetővé teszi a felhasználók számára, hogy összefoglalókat keressenek és készítsenek a vizuális adatokból és automatizálja a jelentéskészítést.

A mai videorendszerek hatalmas mennyiségű adatot rögzítenek, és a felvételek megtekintése továbbra is időigényes és nagyrészt manuális. A Milestone Systems új Video Summarization eszközével egy generatív, mesterséges intelligenciával vezérelt, ingyenesen letölthető, és mindössze néhány perc alatt telepíthető közvetlenül az Xprotect Smart Clientbe. A felhasználók pedig csak akkor fizetnek, ha a VLM-et kérik.

VLM mint szolgáltatás fejlesztőknek: Gyártásra kész videointelligenciával bővíthető bármely alkalmazás számára

A Milestone Hafnia VLM as a Service (VLMaaS) segítségével a fejlesztők, integrátorok és partnerek API-hozzáférést kapnak a gyártásra kész videointelligenciához, amely az Nvidia legújabb technológiájára épül.

A VLMaaS segít a fejlesztőknek gyorsan mesterséges intelligencián alapuló megoldásokat létrehozni anélkül, hogy saját mesterséges intelligencia rendszereket kellene beállítani, finomhangolni vagy kezelni – generatív mesterséges intelligenciával egészíti ki a meglévő megoldásokat, függetlenül az aktuálisan alkalmazott analitika szintjétől. Ezáltal gyorsan és egyszerűen hozzáadhatók a fejlett videóintelligencia funkciók az alkalmazásokhoz, legyen szó akár egy minimálisan életképes termék (MVP) teszteléséről, akár egy platform skálázásáról.

A VLMaaS segítségével a mesterséges intelligencia és az analitika fejlesztése jelentősen felgyorsítható – akár 70-szer kevesebb erőfeszítést igényel, mint egy VLM modell finomhangolása ugyanezen cél érdekében.

A főbb funkciók:
  • Hozzáférés a nagy pontosságú vizuális nyelvi modellhez, forgalomra optimalizált adatok finomhangolása és az Nvidia Cosmos Reasonra épülés
  • A forgalommal kapcsolatos műveletekhez tartozó utasítások követése
  • API-alapú szállítás – egyszerű integráció HTTPS-en keresztül
  • Finomhangolt modellek az amerikai és az EU piacaira, további régiókkal a jövőben
  • Önálló megoldások létrehozására vagy a Milestone termékportfólióval való integrációra tervezve
  • 100%-ban megbízhatóan beszerzett betanítási adatok auditálható adatsorral, GDPR- és EU AI Act-kompatibilis, a modell finomhangolására használják

A VLMaaS árazása használatalapú (API-hívásokon alapuló), ami azt jelenti, hogy nincsenek nagy előzetes beruházások vagy egyedi betanítási költségek.

Forrás: Milestone Systems