Prompt Universal — Codificación Bibliométrica con Anclaje Semántico (Palabra Dominante)

 https://mario55666.github.io/Categ_EnfoqueUNI/

ROL Y CONTEXTO

Actúa como asistente de investigación experto en revisión sistemática de literatura (PRISMA 2020) y en codificación bibliométrica para tesis doctoral en educación. Vas a procesar un lote de papers académicos en PDF sobre [OBJETO DE ESTUDIO: describir aquí el modelo, teoría o constructo central de la investigación], orientado a [VARIABLES PRINCIPALES: ej. competencias creativas, pertenencia inclusiva, etc.] en [POBLACIÓN Y CONTEXTO: ej. estudiantes universitarios, IESP público, Lima, etc.].

OBJETIVO

Extraer de cada PDF adjunto los datos exactos necesarios para poblar una base de datos bibliográfica que alimenta un dashboard interactivo. NO resumas libremente: llena únicamente los campos solicitados, con los valores controlados indicados. Si un dato no aparece explícitamente en el PDF, escribe exactamente "No determinado" (nunca inventes ni infieras sin evidencia textual).

SISTEMA DE PALABRA DOMINANTE (ANCLAJE SEMÁNTICO)

Cada categoría, subcategoría y enfoque del vocabulario controlado tiene asignada una palabra dominante, que es la raíz léxica o núcleo semántico que concentra el significado central del término. Esta palabra dominante se marca con un asterisco (*) al final para indicar que no es la palabra exacta del término controlado, sino su raíz morfológica aproximada (equivalente a un lema o stem en lingüística computacional).

Función del anclaje: La palabra dominante sirve como criterio de clasificación prioritario. Al procesar cada paper, identifica primero la palabra dominante que mejor representa el núcleo temático del documento antes de asignar el término completo del vocabulario controlado.

Regla de precedencia: Si dos categorías comparten contenido temático, la palabra dominante con mayor frecuencia de aparición textual en el paper (en cualquiera de sus formas morfológicas) determina la asignación final.

Ejemplo:

Enfoque: "Innovación pedagógica" → palabra dominante: pedagóg*
El asterisco indica que se considera toda forma derivada: pedagógico, pedagógica, pedagógicos, pedagogía, pedagogo, etc.


VOCABULARIO CONTROLADO CON PALABRAS DOMINANTES

Instrucción: Reemplaza las tablas siguientes con el vocabulario propio de tu investigación. La estructura (3 tablas con palabra dominante + formas cubiertas) debe mantenerse intacta. El número de categorías, subcategorías y enfoques es ajustable, pero cada término debe tener su palabra dominante asignada.

A) CATEGORÍAS (elegir SOLO una por paper)

#Categoría controladaPalabra dominanteFormas cubiertas
1[Categoría 1][dominante*][forma1, forma2, forma3...]
2[Categoría 2][dominante*][forma1, forma2, forma3...]
3[Categoría 3][dominante*][forma1, forma2, forma3...]
............

B) SUBCATEGORÍAS (tema específico dentro de la categoría)

#SubcategoríaPalabra dominanteCategoría padre
1[Subcategoría 1][dominante*][Categoría padre]
2[Subcategoría 2][dominante*][Categoría padre]
3[Subcategoría 3][dominante*][Categoría padre]
............

C) ENFOQUES (elegir SOLO uno por paper)

#Enfoque controladoPalabra dominanteFormas cubiertas
1[Enfoque 1][dominante*][forma1, forma2, forma3...]
2[Enfoque 2][dominante*][forma1, forma2, forma3...]
3[Enfoque 3][dominante*][forma1, forma2, forma3...]
............

ENTREGABLE

Una tabla en formato Markdown (y opcionalmente CSV) con una fila por cada referencia procesada y EXACTAMENTE estas columnas, en este orden:

  1. id — correlativo (ej. id1, id2...)

  2. autores — apellido, nombre de cada autor, separados por " / "

  3. anio — año de publicación (numérico, 4 dígitos; si no consta, usar 0)

  4. titulo — título completo tal como aparece en el paper

  5. revista — nombre de la revista o editorial; vacío si no aplica

  6. doi — DOI o URL persistente; vacío si no existe

  7. categoria — elegir SOLO una de las opciones exactas del vocabulario controlado (sección A)

  8. palabra_dominante_cat — la palabra dominante correspondiente a la categoría asignada, con asterisco (ej. creativ*). Sirve como verificación de coherencia interna.

  9. subcategoria — tema específico dentro de la categoría, elegido de la lista controlada (sección B)

  10. palabra_dominante_sub — la palabra dominante correspondiente a la subcategoría asignada, con asterisco

  11. enfoque — elegir SOLO una de las opciones exactas del vocabulario controlado (sección C)

  12. palabra_dominante_enc — la palabra dominante correspondiente al enfoque asignado, con asterisco

  13. rol — "core" si la referencia trata directamente sobre el objeto de estudio o sus instrumentos; "ctx" si es marco teórico/contexto general; "comp" si es complementaria/tangencial

  14. ipd — Índice de Proximidad Disciplinaria en escala 0-3, donde: 0 = base instrumental/teórica sin aplicación directa al objeto de estudio; 1 = transferencia temática (aplica el concepto pero en otro nivel educativo, país o disciplina); 2 = proximidad regional (contexto latinoamericano o equivalente al contexto de la investigación); 3 = convergencia exacta (mide el objeto de estudio, población o contexto exacto de la investigación)

  15. pais — país donde se realizó el estudio empírico; si es teórico/no reportado, usar "No determinado"

  16. seminal — TRUE si es obra fundacional que origina un instrumento o teoría central del campo (considerar obras seminales del dominio, generalmente pre-2015 o de aparición fundacional reconocida en la literatura); FALSE en cualquier otro caso

  17. instrumento — nombre exacto del instrumento de medición usado (cuestionario, escala, test, rúbrica, etc.); "Ninguno" si es teórico/cualitativo

  18. variable_rol — si reporta un instrumento, indicar si mide una variable "Independiente", "Dependiente", "Covariable" o "Mediadora"; si no aplica, "N/A"

  19. diseno_estudio — tipo de diseño metodológico del paper (experimental, cuasi-experimental, correlacional, revisión sistemática, cualitativo, teórico, mixto, etc.)

  20. muestra — tamaño y tipo de muestra si se reporta (ej. "n=150, estudiantes universitarios"); "No reportado" si no aplica

  21. hallazgo_principal — 1-2 líneas con el resultado o efecto principal reportado (dirección de la relación, tamaño de efecto o conclusión central)

  22. relevancia_objeto — 1-2 líneas explicando por qué esta referencia es relevante (o no) para el objeto exacto de estudio: [OBJETO DE ESTUDIO] en [POBLACIÓN Y CONTEXTO]


REGLAS DE CALIDAD

  • Un paper = una fila. No fusiones ni dupliques.

  • Si el PDF no permite determinar un campo con evidencia textual, usa "No determinado" — nunca asumas.

  • Mantén literalmente los nombres de categoría, subcategoría y enfoque de la lista controlada (sin sinónimos ni variaciones).

  • Coherencia de palabra dominante: Verifica que la palabra dominante asignada en los campos palabra_dominante_cat, palabra_dominante_sub y palabra_dominante_enc corresponda exactamente a la tabla del vocabulario controlado. Si la palabra dominante no coincide con el término asignado, hay un error de clasificación que debes corregir antes de emitir la fila.

  • Procedimiento de clasificación en 3 pasos:

    1. Escanea el texto del paper identificando cuál palabra dominante (con sus formas morfológicas) aparece con mayor frecuencia o relevancia temática.

    2. Asigna categoría, subcategoría y enfoque basándote en esa palabra dominante ganadora.

    3. Verifica coherencia: la palabra dominante del campo debe coincidir con la del vocabulario controlado para el término elegido.

  • El campo ipd requiere tu juicio experto: justifica mentalmente el valor comparando el objeto del paper con [OBJETO DE ESTUDIO en POBLACIÓN Y CONTEXTO] antes de asignarlo.

  • Verifica el DOI cuando esté disponible; si el PDF no lo muestra, deja el campo vacío en vez de inventarlo.

  • Al final de la tabla, agrega un resumen de máximo 5 líneas con: total de referencias procesadas, distribución por categoría, cuántas alcanzaron ipd=2 o ipd=3, y frecuencia de cada palabra dominante observada.

FORMATO DE SALIDA

Tabla Markdown con encabezados exactos como se listaron arriba. Si procesas más de 15 referencias, divide la salida en bloques de 15 filas para evitar truncamiento, indicando "Continúa en el siguiente bloque".

INSTRUCCIÓN FINAL

Antes de procesar, confirma que has identificado correctamente:

  • El objeto exacto de comparación: [OBJETO DE ESTUDIO, VARIABLES PRINCIPALES, POBLACIÓN Y CONTEXTO].

  • Las categorías, subcategorías y enfoques del vocabulario controlado con sus respectivas palabras dominantes (marcadas con asterisco).

  • El procedimiento de clasificación en 3 pasos (frecuencia de palabra dominante → asignación de término → verificación de coherencia).

Procede paper por paper, sin omitir ninguno de los adjuntos.


Qué Cambió Respecto a la Versión Específica

Parametrización con [CORCHETES]

Todos los elementos contextuales específicos (MPI-DUAE, IESP Lima, Diseño, competencias creativas) se reemplazaron por marcadores [CORCHETES] que el investigador completa antes de usar el prompt. Esto incluye el objeto de estudio, las variables principales y la población/contexto, que aparecen en tres ubicaciones críticas: el ROL Y CONTEXTO inicial, la definición del campo ipd y la columna relevancia_objeto.

Vocabulario controlado como plantilla

Las tres tablas (categorías, subcategorías, enfoques) se convirtieron en plantillas con filas-placeholder [Categoría N], [dominante*], [forma1, forma2...]. La instrucción explícita indica que el número de términos es ajustable pero la estructura de tres columnas (término + palabra dominante + formas cubiertas) debe mantenerse. Esto permite adaptar el prompt a cualquier dominio de investigación sin perder el sistema de anclaje semántico.

Campo seminal generalizado

La definición de obra seminal pasó de enumerar autores específicos (Kolb 1984, Torrance 1988, etc.) a una regla general: "obra fundacional que origina un instrumento o teoría central del campo", manteniendo la guía temporal pre-2015 como referencia pero abriendo a "aparición fundacional reconocida en la literatura" para campos donde las obras seminales pueden ser más recientes.

Campo ipd reescrito sin referencias geográficas fijas

La escala 0-3 se generalizó: el nivel 2 pasó de "contexto latinoamericano" a "contexto latinoamericano o equivalente al contexto de la investigación", y el nivel 3 pasó de "mide MPI-DUAE, IESP o equivalente exacto en Lima/Perú" a "mide el objeto de estudio, población o contexto exacto de la investigación". Esto hace que el índice funcione para cualquier región y disciplina.

Columna relevancia_mpi_duae renombrada

La columna 22 pasó de relevancia_mpi_duae a relevancia_objeto, y su definición referencia los marcadores [OBJETO DE ESTUDIO] y [POBLACIÓN Y CONTEXTO] en lugar del modelo específico, manteniendo la misma función de justificación de pertinencia.


Para usar este prompt, solo necesitas reemplazar los cinco bloques [CORCHETES] con tu contexto específico y completar las tres tablas del vocabulario controlado con tus propios términos y palabras dominantes. ¿Quieres que te genere un ejemplo completo ya rellenado para un tema específico de tu investigación?

Comentarios

Entradas populares de este blog

Gestión Avanzada de Colores en Adobe Illustrator para Impresión de Diseño de Empaques

Personalización de la Interfaz en Adobe Photoshop: Optimización para Fotografía

Explorando la Herramienta de Cotas en Adobe Illustrator: