Esfera de investigación

La metodología de investigación de Genoma parte de un enfoque cualitativo y se apoya en datos cuantitativos, por lo tanto, utiliza un método mixto. Se propone un enfoque de investigación social aplicada, que tendrá en cuenta diversos escenarios y fuentes de información sobre el estado de las relaciones de las modalidades e instancias formales de participación del grupo poblacional con el que se pretende trabajar, así como las organizaciones de la sociedad civil y otros actores que forman parte del proceso investigativo. Cuenta, además, con cinco intereses investigativos iniciales, relacionados con el funcionamiento del sistema de participación de la ciudad y tres herramientas que facilitan el análisis integral de los problemas sobre los que se desarrolla la investigación.

Está enfocada, además, en analizar acciones estratégicas Top-Down diseñadas e implementados por agentes públicos, como políticas, planes, programas, proyectos, presupuestos e indicadores. También tiene en cuenta el plano normativo multinivel, con un énfasis especial en las normas expedidas en el plano local, sin perder la relación con las disposiciones estatales del nivel central, adquiridas en el marco de alianzas de diferentes tipos, o, legislación a nivel nacional que refrenda la construcción de políticas, u otras acciones referentes al grupo poblacional foco de la investigación.

Además de este foco inicial de análisis, la investigación se propone experimentar con la integración de sistemas de información (públicos y privados) que permitan realizar cruces que le den valor a la información con relación al grupo poblacional con el que se pretende construir la investigación.

Finalmente, la investigación se enfocará en indagar y experimentar con los procesos de relacionamiento del grupo poblacional con la información recolectada, para construir bases sólidas en procesos de apropiación de la información para la participación, teniendo en cuenta la ventana de oportunidad que se abre con el proceso de modernización del Estado, de forma concreta con los compromisos adquiridos por el estado colombiano en alianzas como OGP, o grupos como la OCDE, en campos como la participación, el control social, el acceso a la información, el ciclo presupuestal, la rendición de cuentas y los procesos de comunicación.

../_images/esferas_investigacion.png

Figura 1 Esfera de investigación

Metodología general

Fase 1. Problematización

A partir de los intereses de investigación del proyecto se establecen preguntas, criterios y límites que guiarán las siguientes fases de la investigación.

Fase 2. Recolección de información

Enfocada en captar la información referente al interés investigativo que se esté analizando. Esta recolección de información parte de los siguientes elementos:

Fuentes Primarias:

  • Actas modalidades e instancias de participación: referente a los documentos realizados por las modalidades e instancias de participación que recogen información relacionada con su funcionamiento y relacionamiento.

  • Funcionarios públicos: personas que integran la administración pública y se encargan del diseño, implementación o evaluación de acciones enfocadas en la población con la que trabaja Genoma.

  • Sociedad civil: actores relacionados con las acciones dirigidas hacia la población foco del proyecto.

  • Exfuncionarios públicos: personas que hicieron parte de la Administración Municipal y desarrollaron labores relacionadas con el diseño, implementación o evaluación de acciones dirigidas a la población en la que se centra Genoma

  • Acciones o estrategias (políticas, planes, programas y proyectos): relacionados con la población foco del proyecto.

  • Sistemas de información: sistemas de información disponibles, estructurados y no estructurados, relacionados con la población foco del proyecto.

Fuentes secundarias:

  • Investigaciones: relacionadas con las acciones llevadas a cabo por las organizaciones públicas enfocadas en la población e intereses de investigación del proyecto.

  • Páginas web: aquellas relacionadas con la población foco del proyecto.

  • Académicos: miembros del sector académico involucrados en los procesos que se desarrollan en torno a la población central de Genoma.

Técnicas e instrumentos de recolección de información:

Genoma se apoya en diferentes técnicas de recolección de información. A partir de estas, se diseñan instrumentos específicos según la información que se pretenda recabar. Dichas técnicas son:

  • Entrevista

  • Encuesta

  • Grupos focales

  • Cuestionario

  • Análisis documental

Fase 3. Tratamiento de la información

La información recolectada se categoriza y procesa según la necesidad del proceso definida por los investigadores a cargo.

Fase 4. Análisis de la información

Una vez procesada la información, esta se analiza con el fin de establecer conclusiones y recomendaciones al respecto.

Fase 5. Síntesis

Esta fase retoma el producto de las fases anteriores y ejecuta aspectos relacionados con la consolidación, sistematización, visualización y/o publicación de los resultados de cada eje.

Ejes

Marco de referencia

El marco de referencia remite a un análisis preliminar del contexto de la población en la que se centra el proyecto, así como de las acciones y estrategias puestas en marcha por parte de diferentes actores focalizadas en dicha población. En ese sentido, es preciso tener en cuenta elementos clave como:

  • Antecedentes: enfocados en analizar, en un periodo de tiempo determinado, el contexto en el que se ha desenvuelto la población.

  • Marco jurídico multinivel: cuya función es determinar la delimitación jurídica trazada por el ordenamiento bajo la cual confluyen los diferentes actores y acciones dirigidas a la población foco del proyecto.

  • Experiencias exitosas: mediante el cual se pretende rastrear acciones llevadas a cabo en diferentes territorios que sirvan de referencia para mejorar falencias identificadas durante la implementación del proyecto.

  • Acciones y estrategias: que permitirán establecer conclusiones relacionadas con aspectos referentes a la planeación, eficacia y eficiencias de las acciones públicas dirigidas a la población en la que se centra el proyecto.

Metodología específica

El Marco de referencia sigue las fases propuestas por la metodología general de la esfera de investigación; no obstante, se remite a fuentes e instrumentos diseñados específicamente para su desarrollo.

Fase 1. Problematización: esta fase se desarrolla según la población.

Fase 2. Recolección de información:

  • Fuentes: el Marco de Referencia se remite a todas las fuentes propuestas en la metodología general de la esfera de investigación de Genoma.

  • Técnicas e instrumentos de recolección de información: este componente de la esfera de investigación de Genoma utiliza principalmente el análisis documental y la entrevista para recolectar la información necesaria para la fase de análisis; no obstante, no descarta otro tipo de técnicas.

Fase 3. Tratamiento de la información: en aras de facilitar el análisis de la información recolectada, esta se categoriza según instrumentos previamente diseñados que parten de las necesidades del proceso investigativo.

Fase 4. Análisis de la información: una vez categorizada la información, se procede al análisis de la misma, generando conclusiones que servirán como insumo para la esfera de aplicación de Genoma.

Fase 5. Síntesis:

  • Etapa 1. Consolidación: en esta etapa se realizan todos los ajustes necesarios al documento final del marco de referencia. Esto comprende actividades como corrección de estilo, diagramación, entre otros.

  • Etapa 2. Publicación: una vez consolidado el documento, se publica la investigación.

Mapeo de actores Genoma

El Mapeo de Actores Genoma (MAG) se enfoca en la dinamización de las redes de trabajo conjunto entre los actores que componen el ecosistema de datos abiertos y el sistema municipal de participación de la ciudad. La función de este eje es identificar los diferentes actores y tipos de relaciones que se desarrollan entre ellos y establecer la influencia y roles que estos desempeñan al interior de la red.

Para tal fin, este será construido de manera paulatina con los resultados arrojados por el mapeo de actores focalizado; en ese sentido, el MAG se centra en dos productos, en primer lugar, el Mapeo de Actores Genoma Focalizado (MAGF), enfocado en la población con la que se esté desarrollando el proyecto; y, en segundo lugar, el Mapeo de Actores Genoma (MAG), que consolida los mapeos focalizados construidos con las diferentes poblaciones foco del proyecto.

Metodología específica

Mapeo de Actores Genoma Focalizado (MAGF)

Fase 1. Problematización: se plantea como cuestión principal qué actores y tipo de actores se vinculan, de manera preliminar, al ecosistema en el que se enmarca la población central del proyecto.

Fase 2. Recolección de información: La recolección de información del MAGF está compuesta por dos etapas, la primera realiza un rastreo preliminar de actores:

  • Etapa 1. Rastreo documental de actores clave: el propósito de esta etapa es identificar, a través de diferentes fuentes de información, aquellos actores que sobresalen por las labores realizadas en torno a los temas de interés de Genoma enfocados en la población seleccionada para implementar el proyecto.

    • Fuentes: el MAGF se remite a las fuentes previamente trazadas por la metodología general de la esfera de investigación; no obstante, para su propósito, estas fuentes se delimitan aún más.

      • Fuentes primarias: entre las fuentes primarias utilizadas en la fase 1 del MAG se encuentran:

        1. Actas modalidades e instancias de participación: referente a los documentos elaborados por las modalidades e instancias de participación, los cuales recogen información relacionada con los actores que hacen parte de estas.

        2. Políticas, planes, programas y proyectos: el análisis de estos instrumentos se enfoca en determinar qué actores han sido y son parte del diseño implementación de los mismos, así como aquellos actores o grupos de actores a quienes se han dirigido dichos instrumentos.

        3. Sistemas de información: respecto a esta fuente el análisis se concentra en los actores que proporcionan la información y aquellos que se mencionan en la misma.

      • Fuentes secundarias:

        1. Investigaciones: relacionadas con las acciones llevadas a cabo por las organizaciones públicas enfocadas en la población e intereses de investigación del proyecto

    • Técnicas de recolección de información: el MAGF adopta las siguientes técnicas para recolectar información:

      • Análisis documental: se indaga en diferentes documentos cuyo contenido se relaciona con la participación de diferentes actores en acciones y espacios relacionados con la población foco del proyecto, con el fin de situar actores clave para la fase 2 del MAG.

  • Etapa 2. Consolidación parcial: esta etapa realiza una consolidación de la información recolectada que le sirve de insumo a la esfera de aplicación y comunicación.

  • Etapa 3. Rastreo relacional: una vez identificados los actores en la etapa 1, se procede a determinar el tipo de relación establecidas entre los actores.

    • Fuentes: esta etapa del mapeo se concentra en fuentes primarias como:

      • Sociedad civil: personas, grupos de personas, organizaciones privadas, organizaciones sociales, entre otros, relacionados con las acciones diseñadas e implementadas cuyo objetivo es incidir en la población central del proyecto.

      • Funcionarios públicos: miembros de la Administración Municipal involucrados en el diseño, implementación y evaluación de las acciones dirigidas a la población focal de Genoma.

      • Exfuncionarios públicos: personas que hicieron parte de la administración municipal respecto al diseño, implementación y evaluación de acciones enfocadas en la población central de Genoma.

      • Académicos: personas del sector académico directamente involucradas con actores o acciones enmarcadas en la población foco del proyecto.

    • Técnicas e instrumentos de recolección de información:

      • Entrevistas: partiendo de la información recolectada en la Etapa 1, se aplica un cuestionario a aquellos actores identificados, cuya función es establecer qué relaciones y tipo de relaciones sostienen con otros actores en el marco de las acciones dirigidas a la población foco del proyecto.

Fase 3. Tratamiento de la información: esta fase se lleva a cabo en dos etapas:

  • Etapa 1. Limpieza y homologación de datos: la información recolectada atraviesa un proceso en el que se limpia y organiza de manera tal que se obtengan las tablas de nodos y de aristas, así como sus atributos, de manera tal que puedan ser procesados por el software Gephi.

  • Etapa 2. Construcción de grafos: una vez se homologa la información se construyen los grafos en el software predeterminado y se aplican distribuciones y medidas específicas según el interés investigativo.

Fase 4. Análisis: al finalizar la construcción de los grafos se procede a analizar los resultados arrojados por estos con el fin de generar recomendaciones.

Fase 5. Síntesis:

  • Etapa 1. Sistematización: esta etapa reúne las experiencias generadas alrededor de la construcción del Mapeo de Actores

  • Etapa 2. Consolidación: esta etapa realiza ajustes, tanto al documento final del MAGF, como a la herramienta de sistematización en aspectos como el estilo y la diagramación.

  • Etapa 3. Publicación: posterior a la consolidación de los elementos mencionados, se procede a publicar un documento que integra el análisis y la sistematización del proceso.

  • Etapa 4. Visualización: esta etapa acompaña la etapa anterior y está dirigida a la generación y carga de visualizaciones de los grafos en plataformas virtuales.

InfoData

InfoData concentra diferentes componentes que apuntan a relacionar la gestión y análisis de información relevante para los grupos poblacionales que participan en el proyecto. En ese sentido, constituye la recopilación de información clave, tanto del contexto poblacional, como del contexto de acciones de intervención llevadas a cabo por la administración pública en sus diferentes escalas.

En este eje se integran conjuntos de sistemas de información que se encuentran relacionados con el fin de maximizar el valor de sus datos. Se hace referencia entonces a una red conceptual en la que se cruza el mayor número de información de los conjuntos de datos obtenidos para generar análisis útiles para la investigación, así como estándares que puedan mejorar la coordinación de las instituciones públicas y fortalecer los sistemas de transparencia, haciendo más comprensible la información disponible.   InfoData se configura alrededor de tres elementos principales:

  • Red conceptual: es el conjunto de sistemas de información con sus respectivas conexiones, documentación y análisis realizados anteriormente. Pretende ser una base de datos de grafos que contenga toda la información recolectada, así como las relaciones conceptuales que se encuentran entre los sistemas de información. Podría ser catalogado como un grafo de conocimiento cuyos nodos o conceptos son los sistemas de información que se recolectan para cada población. Tal sistema se diseña con el fin de realizar análisis conceptuales y documentar, almacenar y controlar los análisis y las conexiones que se vayan descubriendo en los sistemas de información. Esta red utiliza los mismos criterios de diseño empleados en los grafos de conocimiento.

  • Grafo de conocimiento: según OntoText, un grafo de conocimiento es un modelamiento en semántica formal de las relaciones entre un grupo de conceptos. Representa una colección de relaciones y descripciones de entidades que son representaciones de objetos reales, situaciones o contextos. Estos grafos presentan dos características principales. En primer lugar, las descripciones de las entidades tienen una estructura formal que permite a las personas y los computadores procesarlas de manera eficiente y unívoca; y, en segundo lugar, las descripciones de cada entidad se complementan con las otras, formando una red, donde cada entidad representa una parte de la descripción de la otra relacionada.  Para el caso de Genoma, las entidades corresponden a cada uno de los sistemas de información que se encuentran, donde la descripción de cada sistema de información sería dependiente de sus relaciones con los otros, ya sean directas o contextuales. Por ejemplo, los datos del SECOP tienen un código BPIN que identifican a un proyecto de alguna entidad pública matriculado en el DNP. De manera que la contratación pública puede estar relacionada con cada proyecto municipal. Esto posibilitará que, en el análisis de los planes, programas y proyectos de una administración no sólo se enlacen los datos de planes indicativos y planes de acción, sino que también se revise la contratación asociada. Los análisis de estos datos se documentan con ayuda de ontologías, un concepto complementario al de grafo de conocimiento.

  • Ontología: una ontología es una descripción formal de los conceptos que conforman una entidad y las relaciones que guardan entre sí, de esta manera se pueden trazar relaciones formales entre los componentes de varios sistemas de información. Es así que las ontologías pueden introducir conocimiento reusable y compartible de manera que se pueda integrar con varios sistemas de visualización y cumpliendo altos estándares de usabilidad.

Un ejemplo de lo anterior es una ontología publicada en Github para OCDS, donde una vez importada, se puede obtener algunos indicadores y banderas rojas. En este repositorio se encuentran los algoritmos, las relaciones y los análisis hechos en OCDS. Con este módulo, se puede entender fácilmente cómo se relacionan las diferentes etapas de la contratación pública y, sobre todo, qué campos se relacionan en diferentes contextos como el legal, el económico y el político. Estas ontologías serán utilizadas por Genoma en aras de integrarlas al grafo de conocimiento y fomentar la construcción de análisis colaborativo.

Metodología específica

Fase 1. Problematización: las problemáticas en este módulo se enfocan en la detección de ausencia de datos claros, con calidad y con buen soporte que sean requeridos por organizaciones ciudadanas, empresas o actores estatales. Si estos datos existen, se buscarán y se integrarán con los sistemas de información ya existentes.

Fase 2. Recolección de información: enfocada en captar la información referente al interés investigativo que se esté analizando. Esta recolección de información parte de los siguientes elementos:

  • Etapa 1. Indagación de fuentes: para la esfera investigativa del proyecto se han definido las siguientes fuentes teniendo en cuenta los objetivos y actores que se pretende alcanzar:

    • Sistemas de información:

      • No estructurados: conjuntos de datos ya existentes dirigidos a la población específica. De manera que se recogerían las bases de datos, debidamente anonimizadas, que las diversas instituciones estatales tienen sobre cierta población.

      • Estructurados: conexiones a los sistemas de información ya existentes y debidamente digitalizados, como SECOP, Compra Eficiente, Presupuesto y todos aquellos datos contenidos en el portal de datos nacionales.

    • Acciones o estrategias: digitalización de archivos de interés provenientes de la administración pública que se encuentren físicos o poco estructurados, como PDF, para sistematizarlos e integrarlos con otros datos de interés.

  • Etapa 2. Selección de información: en esta etapa se analiza la calidad del sistema de información y cuánta información se puede extraer de allí. Además, se evalúa la cobertura de los datos, el contexto, la vigencia temporal, la cantidad de valores nulos en las columnas de interés y se determina si se debe seguir con el proceso de análisis o no. El proceso de evaluación se lleva a cabo teniendo en cuenta criterios predeterminados y un sistema de puntuación que permite seleccionar la información más apta para el desarrollo del proyecto.

    • Criterios: los criterios utilizados para evaluar la información son:

      • Importancia: se estima la importancia de un sistema de información para los análisis poblacionales.

      • Interoperabilidad: determina si los sistemas de información tienen información que pueda trazarse, ser compartida y cruzar información.

      • Confidencialidad: evidencia si los sistemas de información cumplen protocolos de protección y seguridad de la información establecidos por la normatividad colombiana y la Guía de Estándares de Calidad e Interoperabilidad del gobierno colombiano.

      • Soporte: se verifica que los sistemas de información estén actualizados, no sean obsoletos y tengan el respectivo mantenimiento que requieren.

      • Accesibilidad: constata si el acceso a los sistemas de información se da de manera pública o es restrictiva, además si existen en medio digital o impreso.

      • Calidad: comprende que los datos recolectados en los sistemas de información sean legibles, verídicos y cuenten con una estructura clara, además de estar en los formatos adecuados.

      • Cantidad de recursos: hace referencia a la cantidad de datos e información que contengan los sistemas de información.

    • Puntuación: Para seleccionar la información se hace un balance de los criterios anteriormente descritos y se le asigna un puntaje a cada sistema de información de 1 a 10.  Los que alcanzan una puntuación mayor a 6 son escogidos, aunque pueden existir excepciones si se consideran muy importantes.

Fase 3. Tratamiento de la información: el proceso de InfoData procesa la información de la siguiente manera:

  • Etapa 1. Homologación: en esta etapa se tiene en cuenta el lenguaje común de intercambio de información, estándar definido por el Estado colombiano para intercambiar información entre organizaciones, facilitando el entendimiento de los involucrados en los procesos de intercambio de información (MinTIC, 2011). Por otro lado, la integración facilita la unión de este sistema de información a un grafo de conocimiento, permitiendo una vista global frente al relacionamiento de dicho sistema con otros sistemas en Genoma.

  • Etapa 2. Limpieza: en esta etapa se limpia el conjunto de datos de manera que se pueda maximizar el valor extraído de este. Esta limpieza incluye una estandarización de nombres (que todos los nombres de empresas contratadas, por ejemplo, estén escritos de la misma manera), un proceso de anonimización del sistema de información, y estadísticas de cobertura que establezcan cuántos datos nulos existen en cada columna.

Fase 4. Análisis de la información: esta fase se desarrolla en dos etapas:

  • Etapa 1. Análisis: en esta etapa se realizará una validación y una investigación exhaustiva de los conjuntos de datos escogidos, intentando encontrar patrones y valorando más detalladamente la calidad de los mismos. Se trata de correlaciones, modelos estadísticos, test y estadística predictiva que servirán como herramientas para validar o refutar hipótesis previas y nos ayudarán a saber cómo se pueden integrar mejor los sistemas de información recolectados hasta el momento.

  • Etapa 2. Integración: en esta etapa se realizará el proceso de integración del nuevo sistema de información a la red conceptual para documentar sus posibles relaciones y los análisis obtenidos en la etapa anterior.

Fase 5. Síntesis: esta fase está integrada por dos etapas:

  • Etapa 1. Sistematización: solo se aplica para los conjuntos de datos que se encuentren en medio físico o en un medio virtual que requiera intervención humana para la extracción de datos, como PDF. En esta etapa se plantea un sistema sostenible para cada conjunto de datos que permita una digitalización más eficiente para los datos nuevos en el futuro o una extracción de datos más refinada que disminuya el tiempo del proceso. Al tiempo que se recolectan los datos, estos son introducidos en lagos de datos para su almacenamiento y análisis.

  • Etapa 2. Consolidación: en esta etapa se crea la documentación oficial, que incluye la manera de descargar los datos, de ver sus relaciones, de ver su descripción y un informe de su calidad; además, se describe la manera como se puede conectar con otros conjuntos de datos para extraer información clave.