Ant Group, wspierana przez Jacka Ma.
Ludzie powiedzieli, że AT używa lokalnych układów, w tym z Alibaba Group Ltd. Oraz Huawei Technologies, w celu szkolenia modeli przy użyciu SO -zwanej mieszanki podejścia do uczenia się ekspertów. Powiedzieli, że ma wyniki podobne do tych w Nvidia Corp.
Jedna osoba powiedziała, że Hangzhou nadal używa NVIDIA do rozwijania sztucznej inteligencji, ale teraz zależy to od alternatyw, w tym od Advanced Micro Devices Inc. I chińskie frytki z ich najnowszych modeli.
Modele wejściowe ANT mają wyścig między chińskimi i amerykańskimi firmami, które zostały przyspieszone, odkąd Deepseek pokazał, w jaki sposób możliwe modele mogą być przeszkoleni za znacznie mniej niż miliardy zainwestowane przez Openai i Alphabet Inc. Potwierdza to, w jaki sposób chińskie firmy próbują korzystać z lokalnych alternatyw dla najbardziej zaawansowanych półprzewodników w Nvidia. Chociaż nie jest to najbardziej zaawansowane, H800 jest stosunkowo silnym procesorem i obecnie zapobiega Stanom Zjednoczonym z Chin.
Firma opublikowała Papier wyszukiwania W tym miesiącu twierdziła, że jego modele czasami przewyższały Meta Platforms Inc. W niektórych kryteriach, które nie są niezależnie weryfikowane niezależnie. Ale jeśli pracujesz zgodnie z ogłoszeniem, ANT może ustalić kolejny krok naprzód w celu rozwinięcia chińskiej sztucznej inteligencji poprzez obniżenie kosztów wniosków lub wspierania usług sztucznej inteligencji.
Kiedy firmy wlewają świetne pieniądze w sztuczną inteligencję, modele MEE wydawały się między innymi jako powszechna opcja, zyskały spowiedź w ich użyciu przez Google i Hangzhou Startup. Technologia ta dzieli zadania na mniejsze grupy danych, takie jak obecność zespołu specjalistów, z których każdy koncentruje się na kawałku miejsc pracy, co sprawia, że proces ten jest bardziej wydajny. Mrówki odmówiły komentarza w oświadczeniu e -mail.
Jednak szkolenie modeli MEE zwykle zależy od układów o wysokiej wydajności, takich jak jednostki przetwarzania grafiki sprzedawane przez NVIDIA. Jak dotąd koszt był zakazem dla wielu małych firm i szerszym ograniczonym adopcją. ANT pracuje nad sposobami bardziej wydajnego szkolenia LLM i wyeliminowania tego ograniczenia. Jego liściasty tytuł pokazuje to, ponieważ firma określa cel rozszerzenia zakresu „bez doskonałych jednostek przetwarzania grafiki”.
To jest sprzeczne z Nafidią. Dyrektor generalny Jensen Huang argumentował, że zapotrzebowanie na konto wzrośnie nawet wraz z pojawieniem się bardziej wydajnych modeli, takich jak R1 Deepseek, Pozowanie Firmy te będą potrzebować lepszych układów, aby wygenerować więcej przychodów, a nie najtańsze przychody w celu obniżenia kosztów. Utrzymuje się w strategii budowania dużych jednostek przetwarzania graficznego z większym obróbką, tranzystorami i zwiększoną pojemnością pamięci.
Ant powiedział, że kosztuje około 6,35 miliona juanów (880 000 USD) w celu szkolenia symbolu 1 biliona za pomocą urządzeń o wysokiej wydajności, ale jego ulepszone podejście zostanie zmniejszone do 5,1 miliona juanów przy użyciu urządzeń o niskiej dyskryminacji. Symbole to jednostki informacyjne, które model pomieści w celu rozpoznania świata i udzielania użytecznych odpowiedzi na informacje użytkownika.
Ludzie powiedzieli, że firma planuje skorzystać z niedawnej penetracji w opracowanych przez nią modeli dużych języków, Ling-Plus i Ling-Lite, dla rozwiązań sztucznej inteligencji, w tym opieki zdrowotnej i finansowania.
Mrówka Zakup Chińska platforma internetowa haodf.com w tym roku Wzmocnienie Usługi sztucznej inteligencji w zakresie opieki zdrowotnej. W poniedziałek firma powiedziała w poniedziałek, że ANT utworzył AI Assistant w celu wsparcia HAODF Doctors 290 000 z zadaniami takimi jak zarządzanie dokumentacją medyczną.
Firma ma również zastosowanie „asystenta życiowego” sztucznej inteligencji o nazwie Zhixiaobao i AI Financial Advisory Service.
Jeśli chodzi o zrozumienie języka angielskiego, Ant powiedział w swoim artykule, że model Ling-Lite był lepszy w dużym standardzie w porównaniu z jednym z modeli LLAMA w Meta. Ling-Lite i Ling-Plus przekroczyły odpowiednik standardów Deepeek w zakresie chińskich standardów.
Robin Yu, główny urzędnik technologii w AI Solution Co., powiedział.
Ant stworzył modele Ling Open Source. Ling-Lite zawiera 16,8 miliarda nauczyciela, które są regulowanymi ustawieniami, które działają takie jak uchwyty i twarze w celu kierowania wydajnością modelu. Ling-plus ma 290 miliardów nauczycieli, którzy są stosunkowo duże w świecie modeli językowych. Dla porównania eksperci szacują, że GPT-4.5 Chatgpt ma 1,8 biliona parametrów, Według Aby przejrzeć technologię Massachusetts Institute of Technology. Deepsek-R1 On ma 671 miliardów.
Firma stała przed wyzwaniami w niektórych obszarach szkolenia, w tym w stabilności. Powiedział w artykule, że niewielkie zmiany w urządzeniu lub struktura modelu doprowadziły do problemów, w tym skoków w modelach wskaźnika błędów.
Ant powiedziała w poniedziałek, że zbudowała duże modelki, które koncentrowały się na opiece zdrowotnej, które były używane przez siedem szpitali i świadczeniodawców w miastach, w tym w Pekinie i Szanghaju. Powiedziała, że duży model korzysta z Deepseek R1, Qwen i Ant Qwen i może przeprowadzać konsultacje medyczne.
Firma powiedziała również, że uruchomiła dwa czynniki wywiadu medycznego – Angel, który obsługiwał ponad 1000 placówek medycznych, oraz plemię, które wspiera usługi ubezpieczeń medycznych. We wrześniu, menedżer AI Healthcare został uruchomiony w Alipay, jego wniosku o płatności.
Ta historia była pierwotnie pokazana Fortune.com