Запознайте се с френския стартъп, който се надява да се противопостави на OpenAI
Някои състезания приключват, преди наистина да са започнали. Така поне изглежда надпреварата за създаването на най-добрите големи езикови модели (LLM). Тези алгоритми задвижват генеративния изкуствен интелект, който може да произведе подобни на човешките текстове и други материали. OpenAI, американският създател на ChatGPT, изглежда, е много по-напред. Той е създал най-мощния LLM в света, наречен GPT-4. Компанията трупа таланти, данни и изчислителна мощ, за да създаде по-умни модели. В резултат на това тя привлича все повече потребители, а с тях и повече капитал, който да влее в още по-сложни модели.
Но френският стартъп Mistral се опитва да разклати този AI маховик. На 26 февруари той пусна нов LLM. Моделът, наречен Mistral-Large, е по-малък от GPT-4, измерван по броя на параметрите, които използва (обичаен показател за мощността на модела). Въпреки това той почти съперничи на GPT-4 във важни аспекти на производителността, като например разсъжденията. Mistral също така представи и задвижван от Mistral-Large конкурент на ChatGPT - Le Chat (произнася се le shah, като френската дума за котка, а не като английския омограф). И обяви сделка с Microsoft - AI гигант, който вече има задълбочено партньорство с OpenAI. Технологичният гигант ще придобие малък дял в Mistral и ще направи моделите на френската компания достъпни чрез своя облак Azure.
Отваряне на индустрията
Mistral е доказателство, че индустрията вече става по-отворена - и по-малко американска. Ако той наистина отправи сериозно предизвикателство към OpenAI, това ще потвърди подозренията на някои представители на индустрията, че при генеративния AI размерът не е всичко. "Вече не е важно да си по-голям - важно е да си креативен и бърз", каза Артър Менш, главен изпълнителен директор на Mistral.
Възходът на френската фирма е бил толкова бърз, колкото северозападният зимен вятър, на който е кръстена. Тя е основана преди по-малко от година и все още има само 25 служители. Въпреки това нейните LLM са водещи в нарастващия брой модели с отворен код, чиито статистически вътрешности, за разлика от затворените черни кутии като GPT-4, са публично достъпни и могат да бъдат променяни от всеки. Това позволи на Mistral да привлече впечатляващите 490 млн. евро (531 млн. долара), което оценява компанията на повече от 2 млрд. долара. Сред големите инвеститори са водещи рискови капиталисти от Силициевата долина като Andreessen Horowitz и General Catalyst, както и технологични светила като Ерик Шмидт, бивш главен изпълнителен директор на Google.
Mistral дължи ранния си успех на умелото съчетаване на основните технически съставки на AI - талант, данни и изчислителна мощ - с политиката, която става все по-важна за AI индустрията, тъй като световните правителства проучват потенциала на технологията.
Да започнем с таланта. Тук Mistral е "чудесно съчетание" между френското инженерно образование и американските технологични гиганти, казва Станислас Полу, съосновател на Dust, друга от множеството AI фирми, които се появяват в Париж. Трима от шестте основатели на Mistral и техническите ? умове - Менш, Тимоте Лакроа и Гийом Лампле - са възпитаници на елитните френски технически училища. Подобно на много други водещи AI изследователи, те са работили в изследователските лаборатории на Google и Meta, друг американски технологичен гигант - обаче в случая на триото те са изграждали LLM в парижките филиали на тези лаборатории, а не в Лондон или Силициевата долина. Това ги поставя сред около 100-те души в световен мащаб, които наистина знаят как да обучават най-съвременните модели.
Още за статията, четете от КАПИТАЛ