Det Kinesiske kunstig intelligens (AI) firma iFlyTek hævder at have de eneste store sprogmodeller (LLMs) der er trænet fuldstændigt på en hjemmeudviklet computing-platform, med-samudviklet med Huawei Technologies, hvilket markerer endnu et skridt i industriens stræben efter selvstændighed i lyset af amerikanske restriktioner.
Mens de fleste af Kinas LLMs er understøttet af computing-platforme der inkluderer amerikanske komponenter som grafikprocessorer (GPUs) fra Nvidia, er iFlyTek fast besluttet på at træne sine LLMs på "selvudviklet, kontrollerbart" infrastruktur, på et tidspunkt hvor Washington i høj grad har afskåret landets adgang til de mest avancerede chips og AI know-how, ifølge Liu Qingfeng, selskabets formand og præsident.
"Hvor langt vi kan gå afhænger af om vi har selvudviklede, kontrollerbare grundlæggende evner til at støtte [AI-udvikling]," sagde Liu torsdag ved en ceremoni, hvor iFlyTek præsenterede sin opdaterede Xinghuo-model. I sin keynote speech, påpegede Liu at amerikanske restriktioner på teknologier der bidrager til udviklingen af LLMs, grundlaget for AI-produkter som OpenAI's ChatGPT, understreger nødvendigheden af, at Kina udvikler sin egen computing-infrastruktur til AI-træning.
Amerikanske sanktioner har begrænset eksporten til Kina af visse teknologier, mest bemærkelsesværdigt de avancerede Nvidia GPUs, der har hjulpet med at drive AI-boomet i de senere år. Liu fortalte publikum, at virksomhedens Xinghuo modeller blev trænet på en computing-platform kaldet Feixing Yihao, der er baseret på Huaweis Ascend computing-løsninger.
Huaweis Ascend AI-chips er hurtigt blevet populære i Kina. Ydeevnen af Ascend 910B-chipset er i visse tests blevet fundet til at levere mellem 80 og 120 procent af Nvidia's A100, når de træner LLMs, sagde Wang Tao, Chief Operating Officer for Jiangsu Kunpeng Ecosystem Innovation Centre, sideløbende med Nanjing World Semiconductor Conference denne måned.
Analytikere har sagt, at Ascend-løsningen er Kinas hidtil bedste forsøg på at udvikle hjemmeproduceret AI-infrastruktur. Der er også stigende støtte fra statsstøttede virksomheder, da de placerer ordrer til Ascend-drevne projekter, sagde Li Yangwei, Beijing-baseret teknisk konsulent inden for intelligent computing.
Endnu mangler Huaweis hardware det livlige udvikler-fællesskab fra Nvidias Cuda-platform, den software der understøtter AI-compute processer på virksomhedens GPUs, ifølge Li. "Chancen for at Huawei indhenter Nvidia er minimal, hvis ikke de løser dette problem," sagde Li.
Ved afsløringen af Xinghuo 4, roste iFlyTeks Liu, at den nye models evner kan matche dem fra GPT-4 Turbo, en af de mest avancerede modeller fra OpenAI, der blev lanceret for mere end otte måneder siden. Xinghuo 4 er allerede blevet anvendt i forskellige forretningscenarier, herunder sundhedsvæsenet, hvor den har hjulpet læger og patienter med diagnose og behandling, ifølge en præsentation ved begivenheden.