EL PROYECTO
Las Relaciones Geográficas se componen de un amplio número de cuestionarios realizados en los cuatro Virreinatos (Nueva España, Nueva Granada, Perú y Río de la Plata), elaborados en respuesta a un Real Decreto emitido por el Rey Felipe II. Inicialmente consistía tan solo en 50 preguntas que posteriormente se extendieron a 255 en 1600. Estos cuestionarios compilaron grandes cantidades de información, organizada en cuatro grandes apartados:
Naturaleza
Moral y política
Organización militar
Vida y creencias religiosas
Aunque dirigida a las autoridades religiosas y políticas españolas, los dirigentes y ancianos indígenas también participaron en la recopilación y redacción de las relaciones en muchos de los casos, proporcionando una visión indispensable de las culturas, las cosmogonías y las culturas indígenas.
La compilación total de documentos consta de miles de páginas que cubren un amplio conjunto de detalles sobre la vida indígena y colonial en los Virreinatos. La falta de un formato estandarizado, junto a la mezcla de español antiguo y de idiomas indígenas, mayormente náhuatl, hace que las relaciones sean un corpus complejo pero rico.
Las Relaciones Geográficas presentan, por lo tanto, un desafío y una oportunidad. La investigación tradicional de estos documentos se ha fundamentado en lecturas minuciosas de tan solo un puñado de estos textos, lo que ha llevado a los estudiosos dedicar toda una vida. Sin embargo, utilizando un conjunto de técnicas computacionales pioneras, este proyecto creará oportunidades inigualables para la investigación y el estudio de estos documentos para futuros investigadores, desarrollando y perfeccionando al mismo tiempo nuevas metodologías computacionales para el análisis y el estudio de fuentes textuales históricas.
OBJETIVOS Y PREGUNTAS
Nuestro análisis de las Relaciones Geográficas:
- Generar, a través de enfoques computacionales, nuevo conocimiento histórico de la conquista de América y los primeros momentos de las colonias.
- Crear metodologías innovadoras para la identificación, la extracción y la relación de la información de las fuentes históricas, facilitando nuevas formas de análisis e interpretación.
- Mejorar y desarrollar las técnicas mencionadas al tiempo que abordamos los desafíos planteados por los enfoques a escala macro de colecciones de texto de interés para los campos de Humanidades.
Para alcanzar estos objetivos, nuestro proyecto aborda una serie de preguntas de investigación tanto históricas como metodológicas, que abarcan análisis a escalas macro y micro de la información recopilada en las Relaciones Geográficas.
Entre otras, algunas de nuestras preguntas de investigación incluyen:
- ¿Cuáles son las geografías contenidas en estas colecciones textuales? En un esfuerzo sin precedentes por localizar el conjunto de localizaciones mencionadas en el corpus, el proyecto utilizará técnicas avanzadas de los SIG para la desambiguación de lugares inciertos, y mapeará todas las ubicaciones posibles, creando un recurso digital geográfico de las Relaciones Geográficas de valor incalculable.
- ¿Quién estuvo involucrado en la recopilación de información para las Relaciones Geográficas? Al desentrañar los datos relacionados con las personas e instituciones que recopilaron el material asociado a cada localidad, el proyecto tendrá como objetivo reconstruir la red de conocimiento de las personas responsables de la creación de este corpus en Nueva España durante el siglo XVI.
- ¿Cuál fue la infraestructura colonial de Nueva España? Fruto de extraer las organizaciones mencionadas en el corpus, proporcionaremos una imagen completa de las instituciones educativas, religiosas y económicas de los territorios mexicanos de Nueva España.
- ¿Cómo podemos superar la brecha entre la investigación cualitativa y la cuantitativa en Humanidades, a través de métodos digitales del actual estado del arte?
- ¿Cómo pueden los métodos de Lingüistica de Corpus y de Procesamiento Estadístico de Lenguajes Naturales analizar con mayor eficiencia idiomas como el español histórico, para el cual hay menos recursos, y analizar corpora bilingües o incluso multilingües?
- ¿Cómo pueden las técnicas de NLP avanzar y desarrollarse para mejorar la identificación y desambiguación de los nombres propios, específicamente los topónimos, en los corpora históricos?
- ¿Cuáles son los desafíos lingüísticos y computacionales para abordar las lenguas prehispánicas, particularmente náhuatl, y cómo podemos resolverlas?
- ¿Cómo podemos usar técnicas innovadoras en SIG y NLP para la desambiguación de lugares en corpora históricos?
METODOLOGÍAS
Tradicionalmente, en campos relacionados con Humanidades como la Historia, la Arqueología, la Literatura o la Antropología, los investigadores pueden pasar sus carreras examinando un conjunto de documentos, buscando conexiones significativas, tratando de responder nuevas preguntas y avanzando en su campo de investigación. Sin embargo, los recientes enfoques de vanguardia -algunos de los cuales han sido desarrollados bajo grandes esquemas de colaboración por parte de los miembros de este equipo- permiten exámenes complejos de grandes colecciones de textos que usualmente comprenden millones de palabras. Nuestra investigación anterior ya ha proporcionado ejemplos sobre cómo al combinar teoría y método de diferentes campos como las Ciencias Informáticas, las Ciencias de la Información Geográfica y las Humanidades pueden facilitar el estudio, la identificación y los análisis lingüísticos, semánticos, geográficos y patrones históricos en corpora de texto a diferentes escalas.
Nuestro equipo es altamente interdisciplinar, combinando técnicas procedentes de diferentes campos entre los que se incluyen:
- Lingüística de corpus
- Minería de Textos
- Procesamiento de Lenguajes Naturales
- Aprendizaje Automático
- Sistemas de Información Geográfica
Este enfoque plantea algunos desafíos metodológicos interesantes, que abarcan desde el tratamiento de un corpus multilingüe (español antiguo e idiomas indígenas, incluido el náhuatl) con ortografía no estandarizada, hasta la incertidumbre geográfica de las localizaciones históricas y los cambios de la toponimia a lo largo del tiempo.
Superar estos desafíos permitirá una interacción sin precedentes con las Relaciones Geográficas, lo que aumentará las posibilidades de futuras investigaciones y análisis de éstas y otras valiosas fuentes históricas.