Etched está construyendo un chip de IA que solo ejecuta un tipo de modelo

Conforme la IA generativa llega a un número creciente de industrias, las empresas que producen chips para ejecutar los modelos se están beneficiando enormemente. En particular, Nvidia, que comanda entre un 70% y un 95% del mercado de chips de IA, tiene una influencia masiva. Proveedores de servicios en la nube desde Meta hasta Microsoft están gastando miles de millones de dólares en GPUs de Nvidia, cautelosos de quedarse atrás en la IA generativa.

Los vendedores de IA generativa no están contentos con el status quo por razones comprensibles. Una gran parte de su éxito depende de los caprichos de los fabricantes de chips dominantes. Por tanto, ellos, junto con VCs oportunistas, están en la búsqueda de nuevas empresas prometedoras para desafiar a los incumbentes de los chips de IA.

Etched está entre las muchas empresas de chips alternativas que luchan por un lugar en la mesa, pero también es una de las más intrigantes. Con solo dos años de antigüedad, Etched fue fundada por un par de desertores de Harvard, Gavin Uberti (ex-OctoML y ex-Xnor.ai) y Chris Zhu, quienes junto con Robert Wachen y el ex CTO de Cypress Semiconductor Mark Ross buscaron crear un chip que pudiera hacer una sola cosa: ejecutar modelos de IA.

Eso no es inusual. Muchas startups y gigantes tecnológicos tienen o están desarrollando chips que ejecutan exclusivamente modelos de IA, también conocidos como chips de inferencia. Meta tiene MTIA, Amazon tiene Graviton e Inferentia y así sucesivamente. Pero los chips de Etched son únicos en el sentido de que solo ejecutan un tipo de modelo: transformadores.

El transformador, propuesto por un equipo de investigadores de Google en 2017, se ha convertido en la arquitectura de modelo de IA generativa dominante hasta ahora.

Los transformadores sustentan el modelo generador de videos de OpenAI, Sora. Están en el corazón de modelos generadores de texto como Claude de Anthropic y Gemini de Google. Y alimentan generadores de arte como la nueva versión de Stable Diffusion.

“En 2022, hicimos una apuesta de que los transformadores conquistarían el mundo”, dijo Uberti, CEO de Etched, a TechCrunch en una entrevista. “Hemos llegado a un punto en la evolución de la IA donde los chips especializados que pueden desempeñarse mejor que las GPUs de propósito general son inevitables, y los responsables técnicos del mundo lo saben”.

El chip de Etched, llamado Sohu, es un ASIC (circuito integrado específico de la aplicación) - un chip diseñado para una aplicación particular, en este caso, ejecutar transformadores. Fabricado con el proceso de 4nm de TSMC, Sohu puede ofrecer un rendimiento de inferencia dramáticamente mejor que las GPUs y otros chips de IA de propósito general mientras consume menos energía, afirma Uberti.

“Sohu es un orden de magnitud más rápido y barato que incluso las próximas generaciones de GPUs Blackwell GB200 de Nvidia al ejecutar transformadores de texto, imagen y video”, dijo Uberti. “Un servidor Sohu reemplaza a 160 GPUs H100 ... Sohu será una opción más asequible, eficiente y respetuosa con el medio ambiente para los líderes empresariales que necesitan chips especializados”.

¿Cómo logra Sohu todo esto? De varias maneras, pero la más obvia - e intuitiva - es una tubería de hardware y software de inferencia simplificada. Debido a que Sohu no ejecuta modelos que no son transformadores, el equipo de Etched pudo prescindir de componentes de hardware no relevantes para los transformadores mientras reducía la sobrecarga de software tradicionalmente utilizada para implementar y ejecutar modelos que no son transformadores.

Un gráfico de Etched comparando el rendimiento del hardware ejecutando el modelo abierto Llama 70B de Meta.
Créditos de la imagen: Etched

Etched llega al escenario en un punto de inflexión en la carrera por la infraestructura de IA generativa. Más allá de las preocupaciones de costos, las GPUs y otros componentes de hardware necesarios para ejecutar modelos a gran escala hoy en día son increíblemente ávidos de energía.

Goldman Sachs predice que la IA está lista para impulsar un aumento del 160% en la demanda de electricidad de los centros de datos para 2030, lo que contribuirá a un aumento significativo en las emisiones de gases de efecto invernadero. Mientras tanto, los investigadores de UC Riverside estiman que el uso global de IA podría hacer que los centros de datos consuman entre 1.1 y 1.7 billones de galones de agua dulce para 2027, afectando los recursos locales. (Muchos centros de datos utilizan agua para enfriar los servidores).

Uberti presenta optimistamente - o bombásticamente, dependiendo de cómo se interprete - a Sohu como la solución al problema de consumo de la industria.

“En resumen, nuestros futuros clientes no podrán permitirse no cambiar a Sohu”, dijo Uberti. “Las empresas están dispuestas a apostar por Etched porque la velocidad y el costo son existenciales para los productos de IA que están tratando de construir”.

Pero ¿puede Etched - suponiendo que la empresa cumpla su objetivo de llevar Sohu al mercado masivo en los próximos meses - tener éxito cuando tantos otros le siguen de cerca? Aunque Etched carece de un competidor directo en la actualidad, la startup de chips de IA Perceive recientemente presentó un procesador con aceleración de hardware para transformadores. Groq también ha invertido considerablemente en optimizaciones específicas para transformadores para su ASIC.

Dejando de lado la competencia, ¿qué pasa si los transformadores caen en desgracia un día? Uberti dice que, en ese caso, Etched hará lo obvio: diseñar un nuevo chip. Bastante razonable. Pero es un recurso bastante drástico, considerando cuánto tiempo ha tomado llevar a Sohu a la realización.

Ninguna de estas preocupaciones ha disuadido a los inversores de verter una enorme cantidad de dinero en Etched.

Hoy, Etched anunció que cerró una ronda de financiamiento de Serie A de $120 millones co-liderada por Primary Venture Partners y Positive Sum Ventures. Con esto, Etched ha recaudado un total de $125.36 millones, y la ronda contó con la participación de inversores ángeles de peso como Peter Thiel (Uberti, Zhu y Wachen son ex alumnos de la beca Thiel), el CEO de GitHub Thomas Dohmke, el co-fundador de Cruise (y de The Bot Company) Kyle Vogt y el co-fundador de Quora Charlie Cheever.

Estos inversores presumiblemente creen que Etched tiene una oportunidad razonable de escalar con éxito su negocio de venta de servidores. Y tal vez la tenga: Uberti afirma que clientes no revelados han reservado “decenas de millones de dólares” en hardware hasta ahora. El próximo lanzamiento de Sohu Developer Cloud, que permitirá a los clientes previsualizar Sohu a través de un patio de juegos interactivo en línea, debería impulsar ventas adicionales, sugirió Uberti.

Sin embargo, todavía parece demasiado pronto para decir si esto será suficiente para impulsar a Etched y su equipo de 35 personas hacia el futuro que imaginan los cofundadores de la empresa. El segmento de chips de IA puede ser implacable en los mejores tiempos - vean los sonados fracasos cercanos de startups de chips de IA como Mythic y Graphcore, y, relacionado, la disminución de la financiación para empresas de chips de IA en 2023.

Uberti hace un fuerte argumento de ventas, sin embargo: “La generación de videos, las modalidades de audio a audio, la robótica y otros casos de uso de IA futuros solo serán posibles con un chip más rápido como Sohu. Todo el futuro de la tecnología de IA será moldeado por si la infraestructura puede escalar”.