Glosario de IA 2026: los términos clave explicados, de los tokens a las alucinaciones

TechCrunchhace 1 h

Una red abstracta de nodos conectados que representa los sistemas de IAPhoto: Google DeepMind / Pexels

La inteligencia artificial ha desarrollado un vocabulario que avanza casi tan rápido como la propia tecnología, y esos términos aparecen ya de forma habitual en titulares económicos, lanzamientos de productos y debates de políticas. Entender un puñado de conceptos básicos hace mucho más fácil seguir ese aluvión de noticias. Este glosario repasa los más importantes en lenguaje claro, sin dar por supuesta una base técnica.

En el centro de la ola actual está el gran modelo de lenguaje, o LLM. Es un tipo de sistema de IA entrenado con enormes cantidades de texto para predecir el fragmento de escritura más probable a continuación dado lo que vino antes. Ese mecanismo de apariencia simple, llevado a una escala enorme, es lo que permite a sistemas como los chatbots producir respuestas fluidas, resúmenes y código. Cuando se habla de IA generativa, suele referirse a los LLM, junto a modelos que generan imágenes, audio o vídeo.

Para procesar texto, los modelos lo dividen en tokens, fragmentos que corresponden aproximadamente a palabras o partes de palabras. Un modelo no lee letras ni frases como las personas; trabaja con tokens, y el número de tokens que puede considerar a la vez se llama su ventana de contexto. Una ventana mayor le permite asimilar más información, como un documento largo, antes de responder.

El entrenamiento es el proceso de construir un modelo exponiéndolo a datos y ajustando sus valores internos, llamados parámetros, hasta que rinde bien. Los parámetros son los valores numéricos que el modelo ajusta durante el entrenamiento, y su cantidad, a menudo en miles de millones, es un indicador aproximado de su tamaño y capacidad. Tras el entrenamiento inicial, los modelos suelen refinarse mediante fine-tuning, un entrenamiento adicional con datos más específicos para moldear su conducta en una tarea concreta.

Un término que ha entrado en el uso cotidiano es alucinación. Describe cuando un sistema de IA produce información que suena plausible pero es falsa o inventada. Las alucinaciones son un desafío fundamental porque el modelo genera texto que suena probable en lugar de recuperar hechos verificados, de modo que puede afirmar cosas incorrectas con el mismo tono seguro que las correctas. Reducir las alucinaciones es un foco principal de la investigación actual.

Una técnica muy usada para hacer los modelos más fiables es la generación aumentada por recuperación, o RAG. En vez de depender solo de lo que el modelo aprendió durante el entrenamiento, el RAG permite al sistema buscar información relevante en una fuente externa, como una base documental, y usarla para fundamentar su respuesta. Esto ayuda a mantener respuestas exactas y actualizadas, ya que el modelo puede recurrir a material actual y no solo a sus datos de entrenamiento.

La inferencia es el término para ejecutar de verdad un modelo ya entrenado y obtener una salida, frente a entrenarlo en primer lugar. Cada vez que le haces una pregunta a un chatbot, eso es inferencia. Importa comercialmente porque la inferencia consume potencia de cálculo cada vez que se usa un modelo, y a gran escala esos costes se acumulan, por lo que una inferencia eficiente se ha vuelto una prioridad competitiva y financiera para las empresas de IA.

Uno de los términos que más rápido crecen es el agente de IA. Un agente es un sistema que no solo responde a una única indicación, sino que puede realizar una serie de acciones para lograr un objetivo, como usar herramientas, navegar por información o ejecutar pasos en secuencia. Los agentes representan un giro de la IA como herramienta de preguntas y respuestas hacia una IA capaz de llevar a cabo tareas de varios pasos, aunque cuán capaces y fiables son en la práctica sigue siendo objeto de debate.

Otros términos se repiten a menudo. Multimodal describe modelos que manejan más de un tipo de entrada o salida, como texto e imágenes juntos. Los modelos de pesos abiertos o de código abierto son aquellos cuyos parámetros se publican, permitiendo a otros ejecutarlos y adaptarlos, frente a los modelos cerrados accesibles solo a través del servicio de una empresa. La ingeniería de prompts se refiere a diseñar la entrada dada a un modelo para obtener mejores resultados.

Conocer estos términos no exige entender las matemáticas que los sustentan, y el vocabulario seguirá evolucionando con el campo. Pero un manejo práctico de los LLM, los tokens, el entrenamiento, las alucinaciones, la inferencia y los agentes cubre la mayor parte de lo que aparece en la cobertura diaria, convirtiendo anuncios de otro modo opacos en algo que un lector general puede seguir y valorar.

Este artículo es un resumen editorial asistido por IA basado en TechCrunch. La imagen es una foto de archivo de Google DeepMind en Pexels.

Para seguir leyendo

Una ilustración abstracta de neuronas interconectadas

Más de Tecnología

El circuito cerebral que te permite pensar y ver a la vez, explicado

Investigadores han identificado un circuito cerebral que parece permitir a la mente conciliar lo que ven los ojos con lo que piensa el cerebro. El hallazgo arroja luz sobre cómo se coordinan la percepción y el pensamiento interno, con implicaciones para entender la atención y los trastornos que la alteran.

Hacker News

Árboles imponentes vistos desde abajo bajo un dosel forestal alto

Tecnología

¿Cómo suben los árboles gigantes el agua 100 metros? Una nueva investigación lo explica

Algunos de los árboles más altos del mundo elevan el agua a más de 100 metros desde sus raíces hasta sus hojas más altas, una hazaña que ha desconcertado a los científicos durante mucho tiempo. Una nueva investigación sugiere que los árboles gigantes lo hacen con menos dificultad de la esperada, afinando cómo entendemos el movimiento del agua en las plantas.

Hacker Newshace 1 h

Un teclado de portátil iluminado con poca luz, que evoca la seguridad informática

Tecnología

PamStealer: el nuevo malware de macOS que roba datos con técnicas sigilosas

Investigadores han detallado PamStealer, un malware de macOS recién descubierto que emplea técnicas especialmente cuidadosas para evitar la detección mientras roba datos. Es un recordatorio de que la plataforma de Apple, mucho tiempo vista como relativamente segura, es un objetivo creciente.

Ars Technicahace 1 h

Un portátil que muestra un navegador web sobre un escritorio

Tecnología

Las mejores alternativas a Chrome y Safari en 2026, y en qué se diferencian

El mercado de navegadores se mueve a medida que nuevos aspirantes cortejan a usuarios descontentos con Chrome y Safari, compitiendo en privacidad, velocidad y, cada vez más, en IA integrada. Esta guía explica las principales alternativas en 2026 y sus compensaciones.

TechCrunchhace 1 h

Un marcador de ubicación mostrado en un mapa digital en la pantalla de un teléfono

Tecnología

Datos de geolocalización: qué significa la prohibición de Virginia de vender tu ubicación

Virginia ha optado por prohibir la venta de datos de geolocalización precisos, restringiendo un floreciente comercio de información sobre los desplazamientos de las personas. Este análisis explica qué son los datos de geolocalización, cómo se recopilan y venden, y por qué cada vez más legisladores quieren limitar la práctica.

Hacker Newshace 1 d