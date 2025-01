O chatbot DeepSeek impactou o mercado de inteligência artificial ao rivalizar com o ChatGPT e conquistar espaço em menos tempo do que o produto da OpenAI. Por trás dessa criação está Liang Wenfeng, fundador da startup que lançou o modelo de IA em 2023.

Quem é Liang Wenfeng

O empresário cresceu na década de 1980 em uma cidade da província de Guangdong, na China. Ele obteve diplomas de graduação e pós-graduação pela Universidade de Zhejiang, em engenharia eletrônica e da informação.

Wenfeng foge do perfil de um pioneiro da inteligência artificial. Apesar de ter surpreendido o Vale do Silício, ele não é um empreendedor natural do mundo da tecnologia, mas das finanças. Em 2015, depois de formado, criou com dois colegas da faculdade o High-Flyer, um tipo de fundo de investimento no qual incorporou inteligência artificial para aprimorar suas estratégias de negociação.

Hobby virou grande negócio. Em 2021, ele começou a comprar milhares de processadores gráficos da Nvidia como um projeto paralelo de IA. Pessoas próximas viam o investimento como um hobby peculiar que, aparentemente, não daria em nada. "Quando o conhecemos, ele era um cara muito nerd com um penteado horrível falando sobre construir um cluster de 10 mil chips para treinar seus próprios modelos. Não o levamos a sério", disse um de seus colegas de negócios ao Financial Times.

Em 2023, Wenfeng fundou a startup DeepSeek como um desdobramento do High-Flyer. O objetivo era desenvolver inteligência artificial geral ou um nível de IA que correspondesse à inteligência humana. Em dezembro do ano passado, ele lançou seu modelo de IA chamado V3 e impactou o mundo.

Alcance da empresa foi um "acidente". Em entrevista à estatal chinesa CCTV, Wenfeng disse que nunca pretendeu que a empresa fosse disruptiva. "Simplesmente aconteceu por acidente", afirmou, acrescentando que ficou "muito surpreso" com a resposta do mercado.

Por que DeepSeek abalou o mundo?

Estima-se que a empresa treinou seu modelo gastando cerca de US$ 6 milhões (cerca de R$ 35,1 milhões). Pode parecer muito dinheiro para quem não é do ramo, mas não chega perto dos US$ 100 milhões (R$ 586 milhões) estimados para treinar o ChatGPT 4. Sam Altman, CEO da empresa americana, chamou a concorrente chinesa de "impressionante". Não custa lembrar que as startups não costumam detalhar seus gastos, então a cifra do DeepSeek pode não ser precisa.

O DeepSeek balançou as ações dos EUA. O investimento no chatbot de ponta por uma fração do custo de seus rivais levantou dúvidas sobre as centenas de bilhões de dólares que estão programados para investimentos no setor e em outros lugares. Segundo a revista de negócios Fortune, as ações da Nvidia caíram 17% na segunda-feira (27), liderando uma liquidação que fez o Nasdaq cair 3%.

Em 20 de janeiro deste ano, foi lançado o DeepSeek R1, o modelo mais atual do chatbot da empresa. Em benchmarks (sistemas de avaliação), ele supera o ChatGPT na resolução de problemas matemáticos, em programação e em "raciocínio" (capacidade de "pensar logicamente e chegar a uma conclusão"). O ChatGPT, no entanto, leva vantagem por suportar imagens (criação e interpretação) e áudio.

A empresa chinesa conseguiu o feito usando 2.000 chips para treinar seu modelo, contra a estimativa de dezenas de milhares usados pela OpenAI. Estima-se ainda que o DeepSeek tenha sido treinado com chips menos avançados —sanções dos EUA limitaram para a China e outros países a importação de chips sofisticados para inteligência artificial.

A aparição do DeepSeek tem sido vista como um "momento Sputnik" da inteligência artificial. O termo faz alusão à corrida espacial entre EUA e União Soviética. Na época, o regime socialista lançou o primeiro satélite artificial, em 1971, superando os EUA. Portanto, o modelo de inteligência artificial da companhia chinesa é considerado um momento de inflexão no desenvolvimento da tecnologia ao conseguir alto nível de evolução com menos recursos.