La generación aumentada por recuperación (RAG) está transformando la forma en que las empresas aprovechan sus bases de conocimiento internas, pero la mayoría de las arquitecturas de referencia asumen recursos a escala empresarial. Este artículo presenta una arquitectura RAG práctica y amigable para PyMEs que equilibra costo, rendimiento y mantenibilidad. Detalla el preprocesamiento de documentos, estrategias de fragmentación, selección de modelos de embedding, bases de datos vectoriales (Milvus, Qdrant, etc.) y técnicas de optimización de recuperación como búsqueda híbrida y re-ranking. También se discuten consideraciones de implementación, incluyendo diseño de puerta de enlace API, almacenamiento en caché y monitoreo. Para fundadores técnicos y líderes de ingeniería que evalúan RAG para su producto, esta arquitectura proporciona un punto de partida concreto que evita la sobreingeniería mientras sigue siendo viable en producción. El enfoque en modularidad y escalado incremental la hace especialmente relevante para startups y equipos de tamaño mediano.
Una guía práctica para construir una arquitectura RAG empresarial adaptada a PyMEs, cubriendo ingesta, recuperación e implementación.