- Aidan Gomez está impressionado com a Deepseek, mas não acha que sua IA esteja pronta para a empresa.
- Em uma entrevista ao Business Insider, o CEO da Cohere disse que as empresas estão procurando modelos personalizados.
- Gomez, um ex-pesquisador do Google, disse que a Deepseek validou sua opinião de que a IA pode ser mais barata.
Aidan Gomez, o CEO da Coere, sentiu -se justificado em sua crença de que a IA poderosa não precisava ser tão cara quando Deepseek lançou um modelo que iria explodir um buraco de US $ 1 trilhão no mercado de ações dos EUA.
“Acho que validou a estratégia de Cohere que buscamos há um tempo”, disse o cientista da computação de 28 anos em entrevista ao Business Insider. “Gastar bilhões de dólares por ano não é necessário para produzir tecnologia de primeira linha que é competitiva”.
Mas enquanto Gomez, ex -pesquisador do Google, considera o R1 de Deepseek um lançamento realmente impressionante “, ele não está convencido de que deve ser uma opção séria para as empresas.
Ele disse que as organizações estão procurando modelos de IA personalizados, em vez de algo fora da prateleira – e são cautelosos ao fornecer acesso às ferramentas da IA a dados confidenciais.
“Não vemos as empresas que vendemos para confiar em R1 para alimentar seus sistemas”, disse Gomez. “Não vemos isso como um concorrente do nosso lado”.
Por que o Deepseek não está pronto para a empresa
Como líder de uma empresa de US $ 5,5 bilhões construindo IA para empresas, Gomez tem um motivo comercial claro para defender esse caso. Mas, como um dos oito pesquisadores do Google Brain que co-autor do seminal de 2017 “Atenção é tudo que você precisa” de papel Isso provocou o boom generativo da IA, sua posição carrega peso.
Ele também não está sozinho, com algumas empresas americanas tentando adotar um Deepseek encontrando uma série de problemas, informou anteriormente.
Para Gomez, a Deepseek não é uma vitória rápida para as empresas – independentemente de quão impressionante seja sua tecnologia.
“O que estamos vendo nas empresas é que elas não querem apenas comprar um modelo”, disse ele. “Você terá que criar algo com esse modelo, terá que implantar muitos recursos técnicos para ver o valor, e isso levará tempo”.
Para desbloquear “um novo nível de valor”, ele acha que as empresas devem considerar cuidadosamente como elas personalizam a tecnologia principal de IA com seus dados proprietários.
Em novembro, em meio a um debate em todo o setor sobre se os ganhos de desempenho da IA haviam atingido um muro, os líderes citaram dados privados e sintéticos como os principais recursos que as organizações devem aproveitar para manter uma vantagem competitiva.
É um ponto ecoado por Gomez. E, como as preocupações que se destacam sobre o Deepseek “Back-end por servidores na China”-os legisladores dos EUA estão buscando proibir o software da startup de dispositivos governamentais-o CEO da Coere disse que as empresas devem colocar a privacidade primeiro se os modelos tocarem “cada vez mais sensíveis dados.”
“Isso é algo que desbloqueará o uso nas empresas porque, no momento, eles hesitam em criar sistemas que tocam dados sensíveis”, disse ele. “Nossos concorrentes o tratam de uma maneira menos segura”.
A Deepseek não retornou os pedidos de comentários do Business Insider sobre suas políticas de privacidade de dados.
Tudo sobre agentes de IA
Enquanto Gomez acha que o R1 de Deepseek é impressionante, ele acredita que o valor real virá de transformar um modelo básico em uma ferramenta que está provando ser outra área quente para o setor este ano: Ai agêntico.
Os programas de software que podem executar tarefas têm sido autonomamente no topo da agenda de líderes empresariais este ano. A Aggalic AI foi um tópico quente na Davos, enquanto o CEO da NVIDIA, Jensen Huang, disse no consumidor Electronics Show que 2025 será o ano em que decolará.
A Cohere, com sede em Toronto, uma das poucas empresas que competem com rivais de IA como Openai, Google e Anthropic, está focada em levar os agentes de IA às empresas.
No mês passado, a Coere introduziu seu programa de acesso inicial para o Norte, sua própria IA agêntica, projetada para atender a cargas de trabalho específicas.
Gomez vê isso como outra maneira de coar ganhar uma vantagem sobre as empresas que apenas desejam implantar um modelo básico como o R1 da Deepseek.
Gomez se recusou a dizer o quanto isso pode custar para adaptar uma plataforma como Norte para as necessidades de empresas específicas. Ele disse que, após um “investimento inicial”, os agentes podem “operar de maneira bastante autônoma” quando estiverem conectados e permitir que as empresas “comecem a colher o valor”.
O CEO da NVIDIA, Jensen Huang, disse que os agentes da IA decolarão em 2025. Getty Images
Deepseek, o disruptor
Apesar de suas preocupações com o Deepseek, Gomez vê a startup saindo de um fundo de hedge chinês como uma força disruptiva positiva para a indústria da IA.
“O fato de eles publicarem seus números de eficiência de treinamento permite que as pessoas vejam que não precisa ser tão intensivo em capital para publicar modelos fantásticos”, disse ele.
Os líderes da IA continuam examinando as alegações da Deepseek de que produziu a IA a par com a apresentação dos melhores modelos do Vale do Silício por uma fração do custo. Enquanto isso, os investidores estão questionando se os grandes gastos com infraestrutura de IA ainda são justificados.
Abordando as implicações do projeto Stargate de US $ 500 bilhões de Sam Altman, Gomez disse que “gastar cada vez mais” em infraestrutura para o treinamento de modelos de IA, em vez de “inferência”, é um erro. A inferência refere -se a um modelo de IA que toma previsões ou decisões sobre novos dados, enquanto o treinamento é o processo de criação de capacidades de um modelo.
“Acho que Deepseek é um grande ponto de prova disso”, disse ele.
A outra implicação do surgimento de Deepseek do nada é a validação de uma abordagem de código aberto.
Embora exista um debate sobre se a IA de Deepseek é realmente de código aberto-ela garantiu uma licença do MIT e abriu seus pesos do modelo, mas não divulgou os dados que usou para treiná-los-Gomez vê “Great Technology” proveniente de ambos abertos -Source e jogadores de código fechado.
Ainda assim, as empresas precisarão de mais do que um modelo chinês impressionante para construir a IA poderosa em suas operações. Como Gomez disse: “Não é apenas o suficiente para baixar um modelo”.