$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Para producir resultados de la muestra, hemos implementado el algoritmo de CaseOLAP en dos partidas/descriptores de asunto: "Las edades" y "Nutrición y enfermedades metabólicas" como casos de uso.
Grupos de edad. Se seleccionaron todos 4 subcategorías de "Las edades" (bebé, niño, adolescente y adulto) como células en un cubo de texto. Las estadísticas y los metadatos obtenidos se muestran en la tabla 3A. La comparación del número de documentos entre las celdas de texto-cubo se muestra en la figura 6A. Adulto contiene 172.394 documentos que es el número más alto en todas las células. Las subcategorías de adultas y adolescentes tienen el mayor número de documentos compartidos (26.858 documentos). En particular, estos documentos incluyen la entidad de nuestro interés solamente (es decir, proteínas mitocondriales). El diagrama de Venn de la Figura 6B representa el número de entidades (es decir, proteínas mitocondriales) encontrado dentro de cada célula y dentro de múltiples superposiciones entre las células. El número de proteínas compartida dentro de todos los grupos de edad subcategorías es 162. La subcategoría adultos representa el mayor número de proteínas únicas (151) seguido del niño (16), niño (8) y el adolescente (1). Se calculó la Asociación de grupo de edad de proteína como un puntaje de CaseOLAP. Las proteínas del top 10 (basadas en su puntaje CaseOLAP) asociadas con subcategorías de bebé, niño, adolescente y adulto son 26-hidroxilasa del esterol, cadena B de alfa-cristalina, 25-hidroxivitamina D-1 alfa-hidroxilasa, Serotransferrin, citrato sintasa, L-seril-tRNA, ATPasa de sodio/potasio-transporte de subunidad alfa-3, Glutathione S-transferase omega-1, NADPH: adrenodoxina oxidorreductasa y reductasa de sulfóxido de metionina péptido mitocondrial (ver figura 6). La subcategoría adultos muestra 10 de heatmap de células con una mayor intensidad en comparación con las células del mapa de calor de la adolescente, el niño y la subcategoría infantil, indicando que las proteínas mitocondriales 10 superior muestran las asociaciones más fuertes a la subcategoría adultos. La proteína mitocondrial esterol 26-hidroxilasa tiene altas asociaciones en todas las subcategorías de edad que se demuestra por las células del mapa de calor con intensidades más altas en comparación con las células del mapa de calor de las otras proteínas mitocondriales 9. La siguiente gama de diferencia de medias con un intervalo de confianza del 99% muestra la distribución estadística de la diferencia absoluta en la puntuación entre dos grupos: (1) la diferencia media entre 'ADLT' y 'INFT' miente en la gama (0.029 a 0,042), (2) la media la diferencia entre 'ADLT' y 'CHLD' se encuentra en el rango (0.021 a 0.030), (3) la diferencia media entre 'ADLT' y 'ADOL' miente en la gama (0.020 a 0.029), (4) la diferencia media entre 'ADOL' y 'INFT' se encuentra en el rango (0.015 a 0.022), (5) la diferencia de medias entre 'ADOL' y 'CHLD' miente en la gama (0.007 a 0.010), (6) la diferencia media entre 'CHLD' y 'INFT' se encuentra en el rango (0.011 a 0.016).
Enfermedades nutricionales y metabólicas. Se seleccionaron 2 subcategorías de "Nutrición y enfermedades metabólicas" (es decir, enfermedad metabólica y trastornos nutricionales) para crear 2 celdas en un cubo de texto. Las estadísticas y los metadatos obtenidos se muestran en la tabla 3B. La comparación del número de documentos entre las celdas de texto-cubo se muestra en la Figura 7A. La enfermedad metabólica de subcategoría contiene 54.762 documentos 19.181 documentos en trastornos nutricionales. La enfermedad metabólica de subcategorías y trastornos nutricionales tienen 7.101 documentos compartidos. En particular, estos documentos incluyen la entidad de nuestro interés solamente (es decir, proteínas mitocondriales). El diagrama de Venn de la figura 7B representa el número de entidades que se encuentran dentro de cada célula y dentro de múltiples superposiciones entre las células. Se calculó la proteína-"Nutrición y enfermedades metabólicas" Asociación como un puntaje de CaseOLAP. Las proteínas del top 10 (basadas en su puntaje CaseOLAP) asociadas con este caso son 26-hidroxilasa del esterol, B de alfa-cristalina L-seril-tRNA synthase del citrato, tRNA pseudouridina sintetasa A, 25-hidroxivitamina D-1 alfa-hidroxilasa, de la cadena Glutathione S-transferasa omega-1, NADPH: adrenodoxina oxidorreductasa, reductasa de sulfóxido de metionina péptido mitocondrial, inhibidor del activador del plasminógeno 1 (se muestra en la figura 7). Más de la mitad (54%) de todas las proteínas se comparten entre las enfermedades metabólicas de subcategorías y trastornos nutricionales (397 proteínas). Curiosamente, casi la mitad (43%) de proteínas asociadas en la subcategoría de enfermedad metabólica son únicas (300 proteínas), mientras que trastornos nutricionales muestran sólo algunas proteínas únicas (35). Cadena B de alfa-cristalina muestra la asociación más fuerte a las enfermedades metabólicas de la subcategoría. Esterol 26-hidroxilasa, mitocondrial muestra la asociación más fuerte en la subcategoría de trastornos nutricionales, lo que indica que esta proteína mitocondrial es altamente relevante en estudios que describen los trastornos nutricionales. La distribución estadística de la diferencia absoluta en la puntuación entre dos grupos 'MBD' y 'NTD' muestra la gama (0.046 a 0.061) para la diferencia de medias como un intervalo de confianza del 99%.

Figura 1. Vista dinámica de flujo de trabajo CaseOLAP. Esta figura representa los 5 pasos principales en el flujo de trabajo de CaseOLAP. En el paso 1, el flujo de trabajo comienza por descargar y extraer documentos textuales (por ejemplo, a partir de PubMed). En el paso 2, los datos extraídos son analizados para crear un diccionario de datos para cada documento, así como una malla para mapeo PMID. En el paso 3, indexación de datos se lleva a cabo para facilitar la búsqueda rápida y eficiente de la entidad. En el paso 4, aplicación de la información suministrada por el usuario categoría (por ejemplo,., raíz malla para cada célula) se lleva a cabo para construir un cubo de texto. En el paso 5, se implementa la operación de la cuenta de la entidad sobre los datos de índice para calcular la puntuación de CaseOLAP. Estos pasos se repiten de manera iterativa para actualizar el sistema con la última información disponible en bases de datos públicas (por ejemplo, PubMed). Haga clic aquí para ver una versión más grande de esta figura.

Figura 2. Arquitectura técnica del flujo de trabajo CaseOLAP. Esta figura representa los detalles técnicos del flujo de trabajo CaseOLAP. Datos del repositorio PubMed se obtienen desde el servidor FTP de PubMed. El usuario se conecta con el servidor de la nube (por ejemplo, la conectividad de AWS) a través de su dispositivo y crea una tubería de descarga que descarga y extrae los datos a un repositorio local en la nube. Los datos extraídos son estructurados, verificados y trajo a un formato adecuado con una tubería de análisis de datos. Simultáneamente, se crea una malla a la tabla de asignación de PMID durante la etapa de análisis, que se utiliza para la construcción del texto-Cube. Analizados los datos se almacenan como un JSON como formato de Diccionario de clave y valor con metadatos (por ejemplo, año de PMID, malla, la editorial). El paso de indexación más mejora los datos mediante la aplicación de Elasticsearch para el manejo de datos a granel. A continuación, el texto-cubo se crea con categorías definidas por el usuario poniendo malla a asignación PMID. Cuando se ha completado la formación de texto-Cube y pasos de la indexación, se lleva a cabo un conteo de la entidad. Datos de la cuenta de la entidad se aplican a los metadatos de texto-Cube. Finalmente, la puntuación de CaseOLAP se calcula basándose en la estructura del texto-cubo subyacente. Haga clic aquí para ver una versión más grande de esta figura.

Figura 3. Una muestra de un documento analizado. Una muestra de los datos analizados se presenta en esta figura. Los datos analizados están dispuestos como un par de clave y valor que es compatible con la indexación y documento la creación de metadatos. En esta figura, un PMID (por ejemplo, "25896987") es que sirve como llave y colección de información asociada (por ejemplo, título, revista, publicación fecha, Resumen, malla, sustancias, Departamento y ubicación) son como valor. La primera aplicación de estos metadatos de documento es la construcción de la malla a PMID mapeo (figura 5 y tabla 2), que más tarde se pone en ejecución para crear el cubo de texto y para calcular el puntaje de CaseOLAP con entidades suministrada por el usuario y categorías. Haga clic aquí para ver una versión más grande de esta figura.

Figura 4. Una muestra de un árbol de la malla. Árbol de acoplamiento de los grupos 'edad es una adaptación de la estructura de datos árbol disponible en la base de datos de NIH (acoplamiento árbol 2018, < https://meshb.nlm.nih.gov/treeView>). Descriptores meSH se implementan con su nodo ID (por ejemplo, personas [M01], [M01.060] los grupos de edad, adolescente [M01.060.057], adulto [M01.060.116], infantil [M01.060.406], infantil [M01.060.703]) para recoger los documentos pertinentes a un descriptor específico de malla ( Tabla 3A). Haga clic aquí para ver una versión más grande de esta figura.

Figura 5. Acoplamiento del mapeo PMID en grupos de edad. Esta figura presenta el número de documentos de texto (cada uno vinculado con un PMID) recogido bajo los descriptores de acoplamiento en "Edades" como un diagrama de burbuja. La malla a los mapas de PMID es generada para proporcionar el número exacto de documentos recogidos bajo los descriptores MeSH. Un total de 3.062.143 documentos únicos fueron recogido bajo los descriptores de malla descendientes 18 (ver tabla 2). Cuanto mayor sea el número de PMIDs seleccionado bajo un descriptor específico de malla, el más grande el radio de la burbuja que representa el descriptor de la malla. Por ejemplo, el mayor número de documentos fueron recogido bajo el descriptor MeSH "Adulto" (1.786.371 documentos), mientras que el menor número de documentos de texto se recolectaron con el descriptor MeSH "Infant, Postmature" (62 documentos).
Se da un ejemplo adicional de malla para mapeo PMID de "Nutrición y enfermedades metabólicas" (https://caseolap.github.io/mesh2pmid-mapping/bubble/meta.html). Se recolectaron un total de 422.039 documentos únicos bajo los 361 descriptores de malla descendentes en "Enfermedades nutricionales y metabólicas". El mayor número de documentos fueron recogido bajo el descriptor MeSH "Obesidad" (77.881 documentos) seguido de "Diabetes Mellitus, tipo 2" (61.901 documentos), mientras que "enfermedad por almacenamiento de glucógeno tipo VIII" exhibió el menor número de documentos (1 documento ). Una tabla relacionada está también disponible en (https://github.com/CaseOLAP/mesh2pmid-mapping/blob/master/data/diseaseall.csv). Haga clic aquí para ver una versión más grande de esta figura.

Figura 6. "Las edades" como un caso de uso. Esta figura presenta los resultados de un caso de uso de la plataforma CaseOLAP. En este caso, nombres de proteína y sus abreviaturas (ver muestra en la tabla 4) se implementan como entidades y "Edades", incluyendo las células: infantil (INFT), niño (CHLD), adolescente (ADOL) y adulto (ADLT), se implementan como subcategorías (véase Tabla 3A). (A) Número de documentos en "Edades": Este mapa muestra el número de documentos distribuidos a través de las células de "Grupos de edad" (para los detalles en el texto-Cube creación ver protocolo 4 y tabla 3A). Un mayor número de documentos se presenta con una intensidad más oscura del mapa de calor (véase la escala) de la célula. Un solo documento puede incluirse en más de una celda. El mapa de calor presenta el número de documentos dentro de una célula a lo largo de la posición diagonal (por ejemplo, ADLT contiene 172.394 documentos que es el número más alto en todas las células). La posición nondiagonal representa el número de documentos, cayendo en dos células (por ejemplo, ADLT y ADOL tienen 26.858 documentos compartidos). (B) . Cuenta de la entidad en "Edades": el diagrama de Venn representa el número de proteínas que se encuentran en las cuatro casillas que representan a "Los grupos de edad" (INFT CHLD, ADOL y ADLT). El número de proteínas compartida dentro de todas las células es 162. El grupo de edad ADLT representa el mayor número de proteínas únicas (151) seguido por CHLD (16), INFT (8) y ADOL (1). (C) CaseOLAP puntuación presentación en "Edades": Las top 10 proteínas con las puntuaciones promedio más altas de la CaseOLAP en cada grupo se presentan en un mapa de calor. Una puntuación de CaseOLAP se presenta con una intensidad más oscura del mapa de calor (véase la escala) de la célula. En la columna de la izquierda aparecen los nombres de la proteína y las células (INFT CHLD, ADOL, ADLT) aparecen a lo largo del eje x. Algunas proteínas muestran una fuerte asociación a un grupo específico de edad (p. ej., 26-hidroxilasa del esterol, cadena B de alfa-cristalina y L-seril-tRNA tienen fuertes asociaciones con ADLT, mientras que la ATPasa sodio/potasio-transporte de subunidad alfa-3 tiene una fuerte asociación con INFT). Haga clic aquí para ver una versión más grande de esta figura.

Figura 7. "Nutrición y enfermedades metabólicas" como un caso de uso: esta figura presenta los resultados de otro caso de uso de la plataforma CaseOLAP. En este caso, nombres de proteína y sus abreviaturas (ver muestra en el cuadro 4) se implementan como entidades y "Nutrición y enfermedad metabólica" entre las dos células: enfermedad metabólica (MBD) y trastornos nutricionales (DTN) se implementan como subcategorías (ver tabla 3B). (A). número de documentos en "Enfermedades nutricionales y metabólicas": este mapa de calor muestra el número de documentos de texto en las celdas de "Enfermedades nutricionales y metabólicas" (para más detalles sobre la creación de texto-cubo 4 protocolo y tabla 3B ). Un mayor número de documentos se presenta con una intensidad más oscura del mapa de calor (ver escala) de la célula. Un solo documento puede incluirse en más de una celda. El mapa de calor presenta el número total de documentos dentro de una célula a lo largo de la posición diagonal (por ejemplo, MBD contiene 54.762 documentos cuál es el número más alto en las dos células). La posición nondiagonal representa el número de documentos compartidos por las dos células (por ejemplo, MBD y NTD tienen 7.101 documentos compartidos). (B). entidad cuenta en "Enfermedades nutricionales y metabólicas": el diagrama de Venn representa el número de proteínas que se encuentran en las dos celdas que representan a "Nutrición y enfermedades metabólicas" (MBD y NTD). El número de proteínas compartida dentro de las dos células es 397. La célula MBD representa 300 proteínas únicas, y la célula NTD representa 35 proteínas únicas. (C). CaseOLAP puntuación presentación en "Enfermedades nutricionales y metabólicas": las proteínas del top 10 con las puntuaciones más altas de CaseOLAP media en "Enfermedades nutricionales y metabólicas" se presentan en un mapa de calor. Una puntuación de CaseOLAP se presenta con una intensidad más oscura del mapa de calor (ver escala) de la célula. En la columna de la izquierda aparecen los nombres de proteínas y células (MBD y NTD) aparecen a lo largo del eje x. Algunas proteínas muestran una fuerte asociación a una categoría de enfermedad específica (p. ej., cadena B de alfa-cristalina tiene una alta asociación con enfermedad metabólica y 26-hidroxilasa del esterol tiene una alta asociación con trastornos nutricionales). Haga clic aquí para ver una versión más grande de esta figura.
| Tiempo (porcentaje del tiempo total) | Pasos en la plataforma de CaseOLAP | Algoritmo y estructura de datos de la plataforma CaseOLAP | Complejidad del algoritmo y estructura de datos | Detalles de los pasos |
| 40% | Descargando y Análisis sintáctico | Iteración y el árbol de análisis de algoritmos | Iteración de bucle anidado y multiplicación de constante: O(n^2), O (log n). Donde n es no de iteraciones. | La tubería de descarga recorre en cada procedimiento en varios archivos. Análisis de un único documento funciona cada procedimiento sobre la estructura de datos XML. |
| 30% | Indexación, búsqueda y creación de cubo de texto | Iteración, algoritmos de búsqueda por Elasticsearch (clasificación, índice de Lucene, colas de prioridad, máquinas de estado finito, poco jugar hacks, regex consultas) | Complejidad, relacionadas con la Elasticsearch (https://www.elastic.co/) | Los documentos están indexados por implementar el proceso de iteración en el Diccionario de datos. La creación de texto-Cube implementa documento meta-datos e información suministrada por el usuario de la categoría. |
| 30% | Entidad de conteo y cálculo de CaseOLAP | Iteración en integridad, popularidad, cálculo de carácter distintivo | O, O(n^2), múltiples complejidades relacionadas con caseOLAP cálculo de puntuación basado en tipos de iteración ¡(1). | Operación de cuenta de entidad enumera los documentos y hacer una operación de cuenta sobre la lista. Los datos de la cuenta de la entidad se utilizan para calcular la puntuación de CaseOLAP. |
Tabla 1. Algoritmos y complejidad. Esta tabla presenta información sobre el tiempo pasado (porcentaje de tiempo total) en los procedimientos (por ejemplo, descargando, análisis), estructura de datos y detalles acerca de los algoritmos implementados en la plataforma CaseOLAP. CaseOLAP implementa la indización profesional y la aplicación de búsqueda denominada Elasticsearch. Información adicional sobre complejidades relacionadas con algoritmos internos y Elasticsearch se puede encontrar en (https://www.elastic.co).
| Descriptores meSH | Número de PMIDs |
| Adulto | 1.786.371 |
| Media edad | 1.661.882 |
| De años | 1.198.778 |
| Adolescente | 706.429 |
| Adulto joven | 486.259 |
| Niño | 480.218 |
| De edad, 80 y más | 453.348 |
| Niño, preescolar | 285.183 |
| Niño | 218.242 |
| Bebé, recién nacido | 160.702 |
| Prematuro | 17.701 |
| Infantil, bajo peso | 5.707 |
| Ancianos frágiles | 4.811 |
| Nacimiento de bebé, muy bajo peso | 4.458 |
| Niño, pequeño para edad gestacional | 3.168 |
| Extremadamente prematuro | 1.171 |
| Infantil, de muy bajo peso | 1.003 |
| Infantil, Postmature | 62 |
Tabla 2. Estadísticas de asignación PMID del acoplamiento. Esta tabla presenta todos los descriptores MeSH descendiente de "Edades" y su número de recogidas PMIDs (documentos de texto). La visualización de estas estadísticas se presenta en la figura 5.
| A | Niño (INFT) | Niño (CHLD) | Adolescente (ADOL) | Adulto (ADLT) |
| Malla de raíz ID | M01.060.703 | M01.060.406 | M01.060.057 | M01.060.116 |
| Número de descriptores MeSH descendiente de | 9 | 2 | 1 | 6 |
| Número de PMIDs seleccionado | 16.466 | 26.907 | 35.158 | 172.394 |
| Número de entidades que se encuentran | 233 | 297 | 257 | 443 |
| B | Enfermedades metabólicas (Mbj) | Trastornos nutricionales (NTD) | | |
| Malla de raíz ID | C18.452 | C18.654 | | |
Número de malla descendiente descriptores de | 308 | 53 | | |
| Número de PMIDs | 54.762 | 19.181 | | |
| Número de entidades que se encuentran | 697 | 432 | | |
Tabla 3. Metadatos de texto-Cube. Se presenta una vista tabular de metadatos de texto-Cube. Las tablas proporcionan información sobre las categorías y descriptor raíces y descendientes, que se implementan para recoger los documentos en cada celda de la malla. La tabla también proporciona las estadísticas de las entidades y documentos recogidos. (A) "Los grupos de edad": esta es una presentación tabular de "Las edades" como niño (INFT), niño (CHLD), adolescente (ADOL) y adulto (ADLT) y su raíz malla ID, número de descendiente descriptores MeSH, número de PMIDs seleccionados y número de encontrar entidades. (B) "Enfermedades nutricionales y metabólicas": esta es una presentación tabular de "Nutrición y enfermedades metabólicas" como enfermedad metabólica (MBD) y trastornos nutricionales (NTD) con su raíz de malla ID, el número de descriptores de malla descendiente, de PMIDs seleccionados y el número de entidades encontradas.
| Proteína nombres y sinónimos | Abreviaturas |
| N-acetilglutamato sintasa, mitocondrial, aminoácido acetiltransferasa, forma larga de N-acetilglutamato sintasa; N-acetilglutamato sintasa forma corta; N-acetilglutamato sintasa conservada dominio formulario] | (CE 2.3.1.1) |
| Deglycase ácido nucleico/proteína DJ-1 (deglycase de Maillard) (Oncogene DJ1) (proteína de la enfermedad de Parkinson 7) (asociada a parkinsonismo deglycase) (DJ-1 de proteína) | (EC 3.1.2.-) (EC 3.5.1.-) (CE 3.5.1.124) (DJ-1) |
| Carboxilasa de piruvato mitocondrial (pirúvico carboxilasa) | (EC 6.4.1.1) (PCB) |
| Componente de bcl-2-enlace 3 (p53 regula para arriba modulador de la apoptosis) | (JFY-1) |
| BH3-interacción agonista de muerte de dominio [BH3-interacción dominio muerte agonista p15 (p15 BID); BH3-interacción dominio muerte agonista p13; BH3-interacción dominio muerte agonista p11] | (22 ofertas) (BID) (p13 BID) (oferta de p11) |
| ATP sintasa subunidad alfa, mitocondrial (ATP sintasa F1 subunidad alfa) | |
| Citocromo P450 11B2, mitocondrial (aldosterona sintasa) (enzima de la síntesis de aldosterona) (CYPXIB2) (citocromo P-450Aldo) (citocromo P-450_C_18) (18-hidroxilasa) | (ALDOS) (CE 1.14.15.4) (CE 1.14.15.5) |
| 60 kDa proteína de choque térmico, mitocondrial (60 kDa chaperonin) (chaperonina 60) (CPN60) (proteína 60 de choque de calor) (proteína de la matriz mitocondrial P1) (proteína P60 de linfocito) | (HSP-60) (Hsp60) (HuCHA60) (CE 3.6.4.9) |
| Caspasa-4 (hielo y Ced-3 homólogo 2) (proteasa TX) [divididos en: caspasas-4 subunidad 1; Caspasa-4 subunidad 2] | (CASP-4) (CE 3.4.22.57) (ICH-2) (ICE(rel)-II) (Mih1) |
Tabla 4. Muestra la tabla de la entidad. Esta tabla presenta la muestra de entidades que en nuestros casos de dos uso: "Las edades" y "Enfermedades nutricionales y metabólicas" (figura 6 y figura 7, tabla 3A,B). Las entidades incluyen abreviaturas, sinónimos y nombres de proteína. Cada entidad (con sus sinónimos y abreviaturas) es seleccionado uno por uno y se pasa a través de la operación de búsqueda de entidad de datos indexados (ver protocolo de 3 y 5). La búsqueda produce una lista de documentos que facilitan aún más la operación de la cuenta de la entidad.
| Cantidades | Definidos por el usuario | Calcula | Ecuación de la cantidad | Significado de la cantidad |
| Integridad | Sí | No | Integridad de usuario define entidades consideradas 1.0. | Representa una frase significativa. Valor numérico es de 1,0 cuando ya es una frase establecida. |
| Popularidad | No | Sí | Ecuación de Popularidad en la figura 1 (flujo de trabajo y algoritmo) de la referencia 5, sección "Materiales y métodos". | Basado en la frecuencia del término de la frase dentro de una célula. Normalizado por frecuencia de plazo total de la célula. Aumento en la frecuencia de término tiene disminución de resultado. |
| Carácter distintivo | No | Sí | Ecuación de carácter distintivo en la figura 1 (flujo de trabajo y algoritmo) de la referencia 5, sección "Materiales y métodos". | Basado en plazo y frecuencia del documento dentro de una célula y a través de las células vecinas. Normalizado por el plazo total y frecuencia de documento. Cuantitativamente, es la probabilidad de que una frase es única en una celda concreta. |
| Puntuación CaseOLAP | No | Sí | Ecuación de resultado CaseOLAP en la figura 1 (flujo de trabajo y algoritmo) de referencia 5, sección "Materiales y métodos". | Basada en integridad, popularidad y carácter distintivo. Valor numérico siempre cae dentro de 0 a 1. Cuantitativamente la puntuación de CaseOLAP representa la Asociación de categoría de frase |
Tabla 5. Ecuaciones de CaseOLAP: CaseOLAP el algoritmo fue desarrollado por Fangbo Tao y Jiawei Han et al. en el 20161. Brevemente, esta tabla muestra el cálculo de la puntuación de CaseOLAP que consta de tres componentes: integridad, popularidad y un carácter distintivo y su significado matemático asociado. En nuestros casos de uso, la puntuación de la integridad de las proteínas es 1.0 (la máxima puntuación) porque están parados como nombres de entidades establecidas. Las puntuaciones de CaseOLAP en nuestros casos de uso pueden verse en la figura 6 y figura 7.