Montera34

Documentación

Herramientas de usuario

Herramientas del sitio


derechoslinguisticos

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
derechoslinguisticos [2025/11/15 13:08] – [Datos] zergalariderechoslinguisticos [2025/11/15 18:32] (actual) – [Repo Git] joseba
Línea 5: Línea 5:
 El proyecto quiere analizar los medios y los trabajadores bilingües necesarios por cada comarca, para garantizar los derechos lingüísticos en Osakidetza.  El proyecto quiere analizar los medios y los trabajadores bilingües necesarios por cada comarca, para garantizar los derechos lingüísticos en Osakidetza. 
  
-==== Objetivos ====+===== Objetivos =====
  
   * Racionalizar el debate sobre derechos lingüísticos y laborales, basándolo en datos.    * Racionalizar el debate sobre derechos lingüísticos y laborales, basándolo en datos. 
  
  
-==== Objetivos para el taller ====+===== Objetivos para el taller =====
  
   * Crear una narrativa para el análisis de los datos de Osakidetza.   * Crear una narrativa para el análisis de los datos de Osakidetza.
Línea 29: Línea 29:
  
  
-=== Datos disponibles ===+==== Datos disponibles ====
  
   * Datos sobre la preferencia lingüística de la ciudadanía vasca.    * Datos sobre la preferencia lingüística de la ciudadanía vasca. 
Línea 35: Línea 35:
   * Fuente: Departamento de Sanidad del Gobierno Vasco.    * Fuente: Departamento de Sanidad del Gobierno Vasco. 
  
-=== Normativa === 
  
-  * ¿?+==== Procesado de datos ====
  
 +En el análisis inicial se han identificado la siguiente estructura de datos según dataset:
 +
 +- Personal osakidetza (XLSX):
 +  * Tabla de acreditaciones.
 +     - Comarcas OSI.
 +        * Acreditados Si/No por comarca.
 +     - Categoría profesional
 +        * Acreditados Si/No por comarca/categoría.
 +
 +  * Tabla de requisitos.
 +     - Comarcas OSI.
 +        * Requisitos Si/No por comarca/categoría.
 +     - Categoría profesional.
 +        * Requisitos Si/No por comarca/categoría.
 +
 +- Preferencia lingüística (PDF):
 +  * Tabla de preferencias lingüísticas.
 +     - Columna de comarcas OSI.
 +     - Columnas de datos por comarca.
 +        * Datos totalizados por comarca.
 +        * Datos de preferencias por género y pacientes pediátricos y adultos.
 +
 +Los datos de las tablas del "Personal osakidetza" son tablas dinámicas incrustadas que solo son accesibles a través de Microsoft Excel. Utilizando dicha herramienta se han transformado los datos para generar un dataset con la siguiente estructura de denominadores comunes:
 +
 +- Personal osakidetza:
 +  * Tabla de acreditaciones.
 +     - Columna de comarcas OSI.
 +     - Columna de categoría profesional.
 +     - Columnas de datos por comarca/categoría.
 +  * Tabla de requisitos:
 +     - Columna de comarcas OSI.
 +     - Columna de categoría profesional.
 +     - Columnas de datos por comarca/categoría.
 +
 +- Preferencia lingüística:
 +  * Tabla de preferencias lingüísticas.
 +     - Columna de comarcas OSI.
 +     - Columnas de datos por comarca.
 +
 +Se han generado tres nuevas pestañas en el Excel, una para ACREDITACIONES, otra para REQUISITOS y otra para PREFERENCIAS en los que se han ordenado y limpiado los datos, unificando los nombres de OSI, borrando columnas y filas y columnas de totalizados.
 +
 +Posteriormente se ha desarrollado un script de Python que en base a estas columnas de Excel, transforma la información y la agrega a un fichero JSON con la siguiente estructura:
 +
 +{
 +  "<NOMBRE_COMARCA>": {
 +    "% Euskera": <número>,  // Solo presente si hay datos de preferencia
 +    "categorias": [
 +      {
 +        "Categoria Profesional": "<nombre_categoria>",
 +        "ACRED": {
 +          "NOTOTAL": <entero>,
 +          "SITOTAL": <entero>,
 +          "TOTAL": <entero>,
 +          "% NO": <decimal_2_decimales>,
 +          "% SI": <decimal_2_decimales>
 +        },
 +        "REQ": {
 +          "REQUISITO SI": <entero>,
 +          "REQUISITO NO": <entero>,
 +          "TOTAL": <entero>,
 +          "% SI": <decimal_2_decimales>,
 +          "% NO": <decimal_2_decimales>
 +        }
 +      },
 +      // ... más categorías
 +    ]
 +  }
 +}
 +
 +Se ha generado además un script para comparar los totales de las acreditaciones por comarca/categoría y sus respectivos requisitos, para asegurar que el total a comparar de ambas tablas es coincidente.
 +
 +
 +=== Instrucciones de scripts ===
 +
 +Script para convertir los datos de excel a JSON:
 +
 +# Con argumentos
 +python convertir_excel_json.py -i "mi_archivo.xlsx" -o "salida.json"
 +
 +# Con nombres largos
 +python convertir_excel_json.py --entrada "C:\ruta\archivo.xlsx" --salida "C:\ruta\salida.json"
 +
 +# Modo interactivo (sin argumentos)
 +python convertir_excel_json.py
 +# Te preguntará: "Ingrese la ruta del archivo Excel de entrada:"
 +# Y luego: "Ingrese la ruta del archivo JSON de salida:"
 +
 +
 +Script para analizar totales:
 +
 +# Con argumentos
 +python analizar_totales.py -i "mi_archivo.json" -o "resultados.txt"
 +
 +# Con nombres largos
 +python analizar_totales.py --entrada "C:\ruta\archivo.json" --salida "C:\ruta\resultados.txt"
 +
 +# Modo interactivo (sin argumentos)
 +python analizar_totales.py
 +# Te preguntará: "Ingrese la ruta del archivo JSON de entrada:"
 +# Y luego: "Ingrese la ruta del archivo de resultados de salida:"
 +
 +
 +
 +==== Repo Git ====
 +
 +https://gitlab.com/yayitazale/derechoslinguisticos/
derechoslinguisticos.1763208489.txt.gz · Última modificación: por zergalari