¿Qué es Few-Shot Learning? Definition & examples

Q: ¿Qué es Few-Shot Learning?

Few-Shot Learning (Aprendizaje con Pocos Ejemplos) es la capacidad de un modelo de inteligencia artificial para resolver una tarea nueva a partir de apenas un puñado de ejemplos, normalmente entre dos y diez, en lugar de necesitar miles de muestras etiquetadas. En el contexto de un modelo de lenguaje grande (LLM), el few-shot no implica reentrenar nada: basta con mostrarle esos ejemplos dentro del propio mensaje y el modelo infiere el patrón que debe seguir.

🤖

Definición

Few-Shot Learning (Aprendizaje con Pocos Ejemplos) es la capacidad de un modelo de inteligencia artificial para resolver una tarea nueva a partir de apenas un puñado de ejemplos, normalmente entre dos y diez, en lugar de necesitar miles de muestras etiquetadas. En el contexto de un modelo de lenguaje grande (LLM), el few-shot no implica reentrenar nada: basta con mostrarle esos ejemplos dentro del propio mensaje y el modelo infiere el patrón que debe seguir.

La idea clave es que el modelo ya trae un conocimiento amplio del mundo aprendido durante su entrenamiento. Los pocos ejemplos no le enseñan algo desde cero, sino que le indican el formato, el estilo y el tipo de respuesta que esperas. Es la diferencia entre enseñar a alguien un idioma entero y simplemente mostrarle tres frases para que entienda qué tono usar.

🎯

Por qué importa

En la práctica casi nunca tienes un conjunto de datos enorme, limpio y etiquetado para cada problema. El few-shot resuelve ese cuello de botella: permite adaptar una IA a un dominio concreto sin recoger datos, sin etiquetar y sin pagar el coste de un entrenamiento completo.

Esto tiene tres consecuencias directas:

Rapidez. Pasas de la idea al resultado en minutos, ajustando los ejemplos del prompt en lugar de montar un pipeline de datos.
Coste bajo. Evitas el ajuste fino (fine-tuning), que requiere infraestructura, tiempo de cómputo y mantenimiento.
Flexibilidad. Cambiar de tarea es tan sencillo como cambiar los ejemplos. Hoy clasificas tickets de soporte, mañana extraes fechas de contratos, sin tocar el modelo.

Por eso el few-shot se ha convertido en una herramienta cotidiana del prompt engineering: es la forma más barata de dirigir el comportamiento de un modelo cuando el zero-shot (pedir la tarea sin ningún ejemplo) no da el resultado esperado.

⚙️

Cómo funciona

El few-shot en modelos de lenguaje se apoya en el aprendizaje en contexto (in-context learning). Los ejemplos viajan dentro del mismo mensaje, dentro de la ventana de contexto del modelo, y este los usa como referencia inmediata al generar su respuesta. No hay actualización de pesos: el aprendizaje ocurre solo durante la inferencia y se olvida en cuanto termina la conversación.

Un prompt few-shot bien construido suele tener tres partes:

Instrucción. Una frase que describe la tarea ("Clasifica el sentimiento de cada frase como positivo, negativo o neutro").
Ejemplos. Dos a cinco pares de entrada y salida que muestran exactamente el formato deseado.
Caso real. La nueva entrada que quieres resolver, dejando que el modelo complete la salida siguiendo el patrón.

Conviene distinguir variantes según el número de ejemplos: zero-shot (ninguno, solo la instrucción), one-shot (un único ejemplo) y few-shot (varios). A más ejemplos no siempre hay más calidad: lo que importa es que sean representativos, coherentes en formato y que cubran los casos difíciles. Cada ejemplo, además, consume tokens, así que hay un equilibrio entre claridad y longitud del prompt.

Conceptualmente, el few-shot bebe del aprendizaje por transferencia (reaprovechar conocimiento de una tarea para otra) y del meta-aprendizaje (aprender a aprender). En un LLM moderno esa transferencia ya está horneada en el modelo, y por eso basta con el contexto del mensaje para activarla.

🌟

Ejemplo

Imagina que necesitas clasificar reseñas de producto y quieres una salida limpia y constante. Un prompt few-shot sería:

Clasifica el sentimiento de cada reseña como POSITIVO, NEGATIVO o NEUTRO. Reseña: "Llegó tarde y la caja estaba rota." → NEGATIVO Reseña: "Funciona bien, cumple lo que promete." → POSITIVO Reseña: "Es un producto más, ni fu ni fa." → NEUTRO Reseña: "La batería dura muchísimo, encantado." →

Con esos tres ejemplos el modelo entiende las etiquetas exactas, el formato de salida y el criterio, y responderá POSITIVO. Si hubieras pedido lo mismo en zero-shot, podría haber contestado con una frase larga, en inglés o con otra etiqueta. Los ejemplos no le enseñan a leer sentimiento, le enseñan cómo quieres la respuesta.

⚠️

Errores comunes

Ejemplos sesgados. Si todos tus ejemplos son del mismo tipo (por ejemplo, solo casos negativos), el modelo tenderá a repetir ese patrón. Equilibra las categorías.
Formato inconsistente. Mezclar separadores, mayúsculas o estructuras entre ejemplos confunde al modelo. La constancia del formato es parte de lo que enseñas.
Demasiados ejemplos. Saturar el prompt encarece cada llamada y puede diluir la instrucción. Empieza con pocos y añade solo si la calidad lo justifica.
Confundir few-shot con fine-tuning. El few-shot no modifica el modelo ni persiste entre sesiones. Si necesitas que el comportamiento sea permanente y a gran escala, el camino es el ajuste fino, no más ejemplos en el prompt.
Ignorar la ventana de contexto. Ejemplos muy largos compiten por el espacio que necesita la tarea real. Recórtalos a lo esencial.

🔗

Relacionado

El few-shot es una de las técnicas centrales del prompt engineering y se combina muy bien con el chain of thought (cadena de pensamiento) para tareas que requieren razonamiento paso a paso. Conviene entenderlo junto a conceptos como el prompt, la inferencia, los tokens y las capacidades generales de la IA generativa. También se relaciona con el zero-shot y el one-shot learning, que son simplemente el mismo enfoque con cero o un solo ejemplo.

ai efficiency learning

🍄

Vill du veta mer?

Om du vill fördjupa dig i Few-Shot Learning (Aprendizaje con Pocos Ejemplos) —eller ta den här typen av utbildning till ditt team— låt oss prata. Jag hjälper team att förstå och tillämpa dessa begrepp. Jag vill gärna höra från dig!

¿Qué es un Bucle de Retroalimentación en IA?

Un Bucle de Retroalimentación en IA es un proceso cíclico donde las salidas...

¿Qué son los Embeddings en IA?

Los Embeddings son representaciones vectoriales numéricas densas que captur...

¿Qué significa Determinístico en IA?

Determinístico en IA se refiere a sistemas que producen exactamente la mism...

¿Qué es Computer Use en IA?

Computer Use o Uso de Computadora en IA se refiere a la capacidad de los si...

¿Qué es Gemma?

Gemma es una familia de modelos de IA abiertos de Google, pensados para eje...