Diferencias

Muestra las diferencias entre dos versiones de la página.

--- derechoslinguisticos [2025/11/15 13:08] – [Datos] zergalari
+++ derechoslinguisticos [2025/11/15 18:32] (actual) – [Repo Git] joseba
@@ Línea 5: / Línea 5: @@
 El proyecto quiere analizar los medios y los trabajadores bilingües necesarios por cada comarca, para garantizar los derechos lingüísticos en Osakidetza.
-==== Objetivos ====
+===== Objetivos =====
   * Racionalizar el debate sobre derechos lingüísticos y laborales, basándolo en datos.
-==== Objetivos para el taller ====
+===== Objetivos para el taller =====
   * Crear una narrativa para el análisis de los datos de Osakidetza.
@@ Línea 29: / Línea 29: @@
-=== Datos disponibles ===
+==== Datos disponibles ====
   * Datos sobre la preferencia lingüística de la ciudadanía vasca.
@@ Línea 35: / Línea 35: @@
   * Fuente: Departamento de Sanidad del Gobierno Vasco.
-=== Normativa ===
-  * ¿?
+==== Procesado de datos ====
+En el análisis inicial se han identificado la siguiente estructura de datos según dataset:
+- Personal osakidetza (XLSX):
+  * Tabla de acreditaciones.
+     - Comarcas OSI.
+        * Acreditados Si/No por comarca.
+     - Categoría profesional
+        * Acreditados Si/No por comarca/categoría.
+  * Tabla de requisitos.
+     - Comarcas OSI.
+        * Requisitos Si/No por comarca/categoría.
+     - Categoría profesional.
+        * Requisitos Si/No por comarca/categoría.
+- Preferencia lingüística (PDF):
+  * Tabla de preferencias lingüísticas.
+     - Columna de comarcas OSI.
+     - Columnas de datos por comarca.
+        * Datos totalizados por comarca.
+        * Datos de preferencias por género y pacientes pediátricos y adultos.
+Los datos de las tablas del "Personal osakidetza" son tablas dinámicas incrustadas que solo son accesibles a través de Microsoft Excel. Utilizando dicha herramienta se han transformado los datos para generar un dataset con la siguiente estructura de denominadores comunes:
+- Personal osakidetza:
+  * Tabla de acreditaciones.
+     - Columna de comarcas OSI.
+     - Columna de categoría profesional.
+     - Columnas de datos por comarca/categoría.
+  * Tabla de requisitos:
+     - Columna de comarcas OSI.
+     - Columna de categoría profesional.
+     - Columnas de datos por comarca/categoría.
+- Preferencia lingüística:
+  * Tabla de preferencias lingüísticas.
+     - Columna de comarcas OSI.
+     - Columnas de datos por comarca.
+Se han generado tres nuevas pestañas en el Excel, una para ACREDITACIONES, otra para REQUISITOS y otra para PREFERENCIAS en los que se han ordenado y limpiado los datos, unificando los nombres de OSI, borrando columnas y filas y columnas de totalizados.
+Posteriormente se ha desarrollado un script de Python que en base a estas columnas de Excel, transforma la información y la agrega a un fichero JSON con la siguiente estructura:
+{
+  "<NOMBRE_COMARCA>": {
+    "% Euskera": <número>,  // Solo presente si hay datos de preferencia
+    "categorias": [
+      {
+        "Categoria Profesional": "<nombre_categoria>",
+        "ACRED": {
+          "NOTOTAL": <entero>,
+          "SITOTAL": <entero>,
+          "TOTAL": <entero>,
+          "% NO": <decimal_2_decimales>,
+          "% SI": <decimal_2_decimales>
+        },
+        "REQ": {
+          "REQUISITO SI": <entero>,
+          "REQUISITO NO": <entero>,
+          "TOTAL": <entero>,
+          "% SI": <decimal_2_decimales>,
+          "% NO": <decimal_2_decimales>
+        }
+      },
+      // ... más categorías
+    ]
+  }
+}
+Se ha generado además un script para comparar los totales de las acreditaciones por comarca/categoría y sus respectivos requisitos, para asegurar que el total a comparar de ambas tablas es coincidente.
+=== Instrucciones de scripts ===
+Script para convertir los datos de excel a JSON:
+# Con argumentos
+python convertir_excel_json.py -i "mi_archivo.xlsx" -o "salida.json"
+# Con nombres largos
+python convertir_excel_json.py --entrada "C:\ruta\archivo.xlsx" --salida "C:\ruta\salida.json"
+# Modo interactivo (sin argumentos)
+python convertir_excel_json.py
+# Te preguntará: "Ingrese la ruta del archivo Excel de entrada:"
+# Y luego: "Ingrese la ruta del archivo JSON de salida:"
+Script para analizar totales:
+# Con argumentos
+python analizar_totales.py -i "mi_archivo.json" -o "resultados.txt"
+# Con nombres largos
+python analizar_totales.py --entrada "C:\ruta\archivo.json" --salida "C:\ruta\resultados.txt"
+# Modo interactivo (sin argumentos)
+python analizar_totales.py
+# Te preguntará: "Ingrese la ruta del archivo JSON de entrada:"
+# Y luego: "Ingrese la ruta del archivo de resultados de salida:"
+==== Repo Git ====
+https://gitlab.com/yayitazale/derechoslinguisticos/