Skip to main content
genealogyclaudeautomation

Claude Code se adentra en la genealogía sin API

Un nuevo workflow en GitHub permite investigar genealogía con Claude Code sin API. Utiliza un ciclo de prompts, un repositorio Markdown y verificación manual. Esto es clave para empresas e investigadores, pues demuestra cómo la automatización con IA puede entrar en nichos complejos sin necesidad de una infraestructura costosa.

Contexto técnico

He explorado el repositorio mattprusak/autoresearch-genealogy, y la idea es sorprendentemente pragmática. Sin magia, sin servidor propio, sin el lío de las claves de API. Solo toma Claude Code, un vault de Markdown al estilo de Obsidian y un ciclo bien definido: encontrar, verificar, registrar y continuar.

Me gustó que el autor no vende un cuento de hadas de que "la IA lo descubrirá todo". Al contrario, el sistema se basa rígidamente en la verificación. Claude lee todo el vault, busca lagunas en el árbol genealógico, propone de 3 a 5 consultas de archivo precisas, marca puntos dudosos y solo actualiza la estructura donde hay confirmación con fuentes.

En esencia, no es un bot, sino un pipeline de investigación. Los datos se almacenan en archivos Markdown simples, el historial de cambios se gestiona con git y el progreso avanza con una mecánica de 'ratchet-loop': solo lo que ha sido verificado entra en la base de datos. Para tareas donde una alucinación cuesta reputación o dinero, este enfoque me parece mucho más atractivo que un chat infinito sin memoria.

Una ventaja adicional es que todo esto funciona incluso sin API. El usuario simplemente interactúa con Claude a través de la aplicación de escritorio o la interfaz web, copia los resultados en el vault y comienza el siguiente ciclo. Sí, no es una automatización completa. Pero la barrera de entrada se reduce drásticamente: no es necesario montar una arquitectura de IA, pagar por tokens ni crear integraciones desde cero.

El caso más sonado en la discusión fue la confirmación de un linaje noble hasta 1431 mediante registros de archivo y verificación iterativa. Yo aquí mantendría la cabeza fría: estas historias siempre deben ser verificadas, especialmente en el umbral de la Baja Edad Media, donde las fuentes secundarias se disfrazan fácilmente de primarias. Pero el patrón en sí es potente: la LLM no "conoce" la genealogía, sino que disciplina la investigación.

En cuanto a los detalles, el repositorio está diseñado para FamilySearch, Ancestry, Google Books, HathiTrust y archivos estatales y eclesiásticos. Es decir, el modelo no accede a las bases de datos por sí mismo, sino que genera hipótesis de búsqueda coherentes. Para mí, esto es la automatización madura: no prometer lo imposible, sino acelerar el cuello de botella donde el ser humano suele ahogarse en la rutina.

Impacto en el negocio y la automatización

Lo más interesante aquí no es la genealogía en sí. Lo veo como una plantilla para cualquier campo con documentos semiestructurados, hechos controvertidos y un largo ciclo de verificación. Archivos, legal discovery, due diligence, compliance, registros históricos, informes médicos, pasaportes técnicos antiguos. En todos ellos existe la misma tensión: no basta con "preguntarle al modelo", sino que es necesario construir un rastro auditable de las decisiones de investigación.

Por eso, soluciones como esta me atraen más que el enésimo lanzamiento "aún más inteligente, aún más rápido". Aquí hay un workflow reproducible. Se puede adaptar para implementar la IA en equipos donde la verificabilidad es crucial: quién encontró qué, en qué fuente se basa la conclusión, qué falta por confirmar y cuál es el siguiente paso. Esto ya no es un juguete, sino el esqueleto de un proceso.

Los grandes ganadores son los equipos pequeños y los especialistas autónomos. Antes necesitaban un investigador caro o semanas de trabajo manual tedioso. Ahora pueden construir una automatización con IA sobre archivos simples y disciplina en los prompts. Pierden aquellos que todavía creen que basta con "conectar una LLM" para que genere resultados de calidad por sí sola.

Constantemente veo el mismo error en los proyectos: la gente quiere una interfaz de usuario, agentes, integración con el CRM y una demo vistosa desde el principio. Pero primero hay que definir el ciclo de investigación y los criterios de verdad. En Nahornyi AI Lab, empezamos precisamente por ahí: diseñamos arquitecturas de soluciones de IA para que el modelo no hable con una confianza vacía, sino que ayude a tomar decisiones verificables.

Si aplicamos este caso a soluciones de IA para empresas, el panorama es sencillo. Tomamos una tarea específica, construimos un knowledge vault, fijamos reglas de verificación, definimos el formato del siguiente paso y solo entonces pensamos en la interfaz y en integrar la inteligencia artificial en los procesos actuales. De lo contrario, acabaremos con un chat caro con un envoltorio bonito.

Recomendaría especialmente este patrón a quienes tienen mucha rutina experta y pocos datos estructurados. No es necesario copiar el repositorio al pie de la letra. A veces basta con adoptar el principio: un ciclo corto, un registro estricto de las fuentes, control de versiones, confirmación manual de los hechos y una LLM como acelerador, no como un oráculo.

Este análisis lo he hecho yo, Vadim Nahornyi de Nahornyi AI Lab. Me dedico a la automatización con IA de forma práctica: construyo workflows, pruebo agentes en procesos reales y materializo todo esto en sistemas funcionales, no en presentaciones. Si quieres discutir tu caso y entender dónde podría funcionar realmente una implementación de inteligencia artificial para ti, escríbeme y analizaremos tu proyecto juntos.

Compartir este articulo