En el discurso de apertura de GTC de Nvidia hoy, el CEO Jen-Hsun Huang anunció que la compañía pronto lanzará una colección de marcos de modelo de lenguaje grande (LLM), conocida como Nvidia AI Foundations. (se abre en una pestaña nueva).
Jen-Hsun tiene tanta confianza en el paquete AI Foundations que lo llama «TSMC para modelos personalizados de lenguaje grande». Definitivamente no es una comparación que esperaba escuchar hoy, pero supongo que encaja con los comentarios melancólicos de Huang sobre que la IA tuvo su «momento iPhone».
El paquete Foundations incluye los servicios Picasso y BioNeMo que servirán a las industrias médica y de medios respectivamente, así como NeMo: un marco dirigido a empresas que buscan integrar grandes modelos de lenguaje en sus flujos de trabajo.
NeMo es «para construir modelos generativos de texto a texto de lenguaje personalizado» que pueden informar lo que Nvidia llama «aplicaciones inteligentes (se abre en una pestaña nueva)«.
Con algo llamado P-Tuning, las empresas podrán entrenar sus propios modelos de lenguaje personalizados para crear contenido de marca más adecuado, redactar correos electrónicos con estilos de escritura personalizados y resumir documentos financieros para que los humanos no tengamos que perder el tiempo mirando números. todo el día, eso suena como una pesadilla para mí.
Con suerte, le quitará un poco de peso al hombre común y evitará que su jefe grite «TAPELO EN LA COSA DEL CHATBOT», porque supuestamente eso es más rápido.
Los modelos de lenguaje de NeMo incluyen 8 mil millones, 43 mil millones, 530 mil millones de versiones de parámetros, lo que significa que habrá distintos niveles para elegir con niveles de potencia muy diferentes.
Por contexto, el GPT-3 authentic de Chat GPT subsistía con 175 mil millones de parámetros, y aunque OpenAI no le cube a la gente cuántos parámetros GPT-4 (se abre en una pestaña nueva) está trabajando en este momento, AX Semantics (se abre en una pestaña nueva) adivina alrededor de 1 billón.
Entonces, no, no va a ser un competidor directo de ChatGPT, y puede que no tenga la misma profundidad de parámetros, pero como marco para diseñar grandes modelos de lenguaje, seguramente cambiará la cara de cada industria que toque. Eso es seguro.