prefeitura-rio · TanookiVerde · Jul 26, 2024 · Jul 22, 2024 · Jul 22, 2024 · Jul 22, 2024
diff --git a/api/app/datalake/__init__.py b/api/app/datalake/__init__.py
@@ -0,0 +1,5 @@
+# -*- coding: utf-8 -*-
+# pylint: disable=W0401, W0614, W0611
+# flake8: noqa: F401, F403
+from app.datalake.utils import register_formatter
+from app.datalake.formatters import *
diff --git a/api/app/datalake/formatters.py b/api/app/datalake/formatters.py
@@ -0,0 +1,97 @@
+# -*- coding: utf-8 -*-
+# =============================================
+# Formatters that are responsible for converting
+# raw JSON records to Datalake table rows.
+# =============================================
+from typing import List
+from app.datalake.utils import flatten, register_formatter
+from app.datalake.models import (
+    SMSRioCnsProvisorio,
+    SMSRioPaciente,
+    SMSRioTelefone,
+    VitacarePaciente,
+    VitacarePacienteHistorico,
+    VitacareAtendimento,
+    VitacareCondicao,
+    VitacareAlergia,
+    VitacareEncaminhamento,
+    VitacareExameSolicitado,
+    VitacareIndicador,
+    VitacarePrescricao,
+    VitacareVacina,
+    VitacareProcedimentosClinicos
+)
+
+
+@register_formatter(system="smsrio", entity="patientrecords")
+def format_smsrio_patient(raw_record: dict) -> List:
+    raw_record['source_updated_at'] = str(raw_record['source_updated_at'])
+
+    flattened_patient = flatten(raw_record)
+    rows = [SMSRioPaciente(**flattened_patient)]
+
+    for field_name, FieldModel in [
+        ('telefones', SMSRioTelefone),
+        ('cns_provisorio', SMSRioCnsProvisorio)
+    ]:
+        # If field not in record, skip
+        if field_name not in raw_record['data']:
+            continue
+
+        for value in raw_record['data'].pop(field_name) or []:
+            rows.append(
+                FieldModel(
+                    value=value,
+                    patient_cpf=raw_record.get("patient_cpf"),
+                    source_updated_at=raw_record.get("source_updated_at")
+                )
+            )
+
+    return rows
+
+
+@register_formatter(system="vitacare", entity="patientrecords")
+def format_vitacare_patient(raw_record: dict) -> List:
+    raw_record['source_updated_at'] = str(raw_record['source_updated_at'])
+
+    flattened = flatten(raw_record, list_max_depth=0)
+
+    # Temporary criterium to discriminate between Routine and Historic format
+    if 'AP' in raw_record['data'].keys():
+        return [VitacarePacienteHistorico(**flattened)]
+    else:
+        return [VitacarePaciente(**flattened)]
+
+
+@register_formatter(system="vitacare", entity="encounter")
+def format_vitacare_encounter(raw_record: dict) -> List:
+    raw_record['source_updated_at'] = str(raw_record['source_updated_at'])
+
+    flattened = flatten(raw_record,dict_max_depth=3)
+
+    rows = [VitacareAtendimento(**flattened)]
+
+    for field_name, FieldModel in [
+        ('condicoes', VitacareCondicao),
+        ('alergias_anamnese', VitacareAlergia),
+        ('encaminhamentos', VitacareEncaminhamento),
+        ('exames_solicitados', VitacareExameSolicitado),
+        ('indicadores', VitacareIndicador),
+        ('prescricoes', VitacarePrescricao),
+        ('vacinas', VitacareVacina),
+        ('procedimentosClinicos', VitacareProcedimentosClinicos),
+    ]:
+        if field_name not in raw_record['data']:
+            continue
+
+        for fields in raw_record['data'].pop(field_name) or []:
+            rows.append(
+                FieldModel(
+                    patient_cpf=raw_record.get("patient_cpf"),
+                    atendimento_id=raw_record.get("source_id"),
+                    source_updated_at=raw_record.get("source_updated_at"),
+                    **fields
+                )
+            )
+
+    return rows