Parte I. Fundamentos y técnicas clásicas
- Introducción al PLN
- Pipeline y preprocesamiento
- Recuperación de información
- Evaluación de IR
- Modelos n-grama
- Clasificación de texto
- Semántica vectorial e incrustaciones
De fundamentos clásicos a modelos neuronales y LLMs
Este libro surge de varios años de docencia en cursos introductorios de procesamiento del lenguaje natural para estudiantes de ingeniería. Su propósito es ofrecer un recorrido coherente, riguroso y pedagógico que conecte la tradición estadística del área con los modelos neuronales y los grandes modelos de lenguaje.
Escribir un libro sobre procesamiento del lenguaje natural en la actualidad puede parecer una decisión difícil de justificar. La disciplina cuenta con textos de referencia consolidados y, además, vivimos en una época en la que los modelos de inteligencia artificial pueden responder preguntas y producir explicaciones casi de manera instantánea.
Sin embargo, este libro no nació para reemplazar obras existentes ni para competir con dichas herramientas. Surgió como resultado de una necesidad docente. Durante varios años, las notas de clase fueron creciendo, reorganizándose y refinándose semestre tras semestre, hasta convertirse en un material estructurado para acompañar de manera progresiva el aprendizaje del área.
El texto busca ofrecer un recorrido coherente que permita comprender la evolución del campo, desde métodos clásicos basados en reglas y estadísticas hasta modelos neuronales, transformers y grandes modelos de lenguaje. Cada capítulo fue concebido como un peldaño para construir el siguiente, procurando que las ideas aparezcan en el momento en que resultan más naturales para el proceso de aprendizaje.
Otro objetivo central de esta obra es contribuir a la disponibilidad de material técnico de calidad en español. El libro intenta reducir la barrera adicional que enfrentan muchos estudiantes cuando deben aprender simultáneamente una disciplina técnica y estudiar en un idioma distinto. Por ello, se propone una exposición rigurosa, pero accesible, escrita íntegramente en español.
Si este material logra facilitar el aprendizaje de nuevos estudiantes, servir como apoyo para docentes y ampliar modestamente la literatura técnica disponible en nuestra lengua, entonces habrá cumplido su propósito.
Rubén Manrique