lunes, 10 de junio de 2013

Ejercicio de probabilidad crapulística

A petición de "La Voz del HULP" y ya que parecen incapaces de RTFM (read the fucking manual) y repasar combinatoria y probabilidad, un ilustrativo ejemplo.

Lo he hecho sobre la marcha así que a lo mejor he metido la pata en algún cálculo, pero al menos les puede servir de punto de referencia para la discusión:


Supongamos 5 varones R5 de interna (Antonio, Baldomero, Carlos, Demetrio, Eugenio) más salidos que las lorzas de Falete y 5 chicas R1s pipiolas que acaban de entrar en el hospital (sus nombres no importan tanto y las llamaremos A,B,C,D,E; también podríamos usar como ejemplo a enfermeras recién terminadas haciendo suplencias de verano en urgencias y que se acercan a los residentes para que les expliquen como se interpreta un electro). Cada uno tiene que ir a saco a pillar con una de las R1 sin saber a por cuál de ellas van a ir los demás competidores.

¿Cuál es la probabilidad de que por puro azar los 5 residentes mayores actúen de manera coordinada de modo que cada uno vaya a por una de las R1 sin competir entre sí?

Imaginemos que van eligiendo:

El primero en elegir, Antonio, tendrá una probabilidad del 100% de elegir a una que nadie haya elegido.

El segundo en elegir, Baldomero, puede elegir a la que ha elegido Antonio (probabilidad 1/5 = 0.2) o elegir a una que no haya elegido Antonio (4/5 = 0.8).

Así que la probabilidad de que Antonio y Baldomero no se pisen entre sí es de 1 * 0.8.

El tercero en elegor, Carlos, puede elegir a una que ya esté elegido (2/5 = 0.4) o a una que esté libre (3/5 = 0.6).

De modo que la probabilidad de que Antonio, Baldomero y Carlos no se pisen entre sí es de:

1 * 0.8 * 0.6

Cuando le toca a Demetrio, ya solo quedan 2 libres, con lo que la probabilidad de que Demetrio elija bien es de (2/5 = 0.4) y la probabilidad de que los cuatro no se pisen es de:

1 * 0.8 * 0.6 * 0.4

Cuando le toca a Eugenio, solo queda una libre, la probabilidad de que elija a esa libre es de 1/5 = 0.2

Por lo tanto la probabilidad de que los 5 residentes mayores actúen por azar de manera coordinada es de:

1 * 0.8 * 0.6 * 0.4 * 0.2 = 0.0384

Esta pregunta se puede resolver de otra forma, que da el mismo resultado:

La probabilidad de que cada uno de ellos escoja una pipiola diferente, por ejemplo

Antonio a por A
Baldomero a por B
Carlos a por C
Demetrio a por D
Eugenio a por E

es de 0.2 * 0.2 * 0.2 * 0.2 * 0.2 = 0.2^5 = 0.00032

¿Pero de cuantas formas distintas podemos ordenar a las 5 pipiolas?

Pues podemos empezar por la A, por la B, por la C, por la D o por la E. Es decir 5 alternativas.

Si empezamos por la A, nos quedan 4 pipiolas por poner. Luego 3 pipiolas, Luego 2 y luego 1.

Es decir el número de formas distintas de ordenar a las 5 pipiolas es de:

5*4*3*2*1 = 5! = 120

Como la probabilidad de coger una permutación de pipiolas es de 0.00032 y hay 120 permutaciones distintas, la probabilidad de que no se pisen entre sí (de que cojan alguna de las permutaciones) es de 0.00032 * 120 = 0.0384

Así que primer problema resuelto.

Ahora imaginemos que los residentes mayores son lo suficientemente crápulas como para pillar con dos R1 pipiolas al mismo tiempo.

Imaginemos que dos de los residentes (Demetrio y Eugenio) son homosexuales y por tanto se abstienen de ligar con las R1. Nos quedan sólo 3 residentes mayores crápulas (Antonio, Baldomero y Carlos).

Si Antonio, Baldomero y Carlos van cada uno a por dos de las 5 R1, la probabilidad de que alguno de ellos se pisen y vayan a por la misma es del 100%.

Si dos de ellos van a por 2 pipiolas y uno de ellos (Antonio) solo va a por una la probabilidad de no pisarse queda así:

Antonio solo va a por una de las 5 y no se pisa con nadie en el 100% de los casos.

Baldomero va a por dos, una de ellas ya está pillada por Antonio, así que la probabilidad de que la primera que elija no sea la de Antonio es de 4/5 = 0.8. La probabilidad de que la segunda con la que intente pillar no sea la elegida por Antonio es de 3 / 4 = 0.75 (elige entre 4, quitando la primera que eligió). Así que la probabilidad de que escoja dos pipiolas y que ninguna de ellas sea la de Antonio es de:

0.8 * 0.75 = 0.6

Ahora es el turpo de Carlos. Antonio y Baldomero ya han elegido a sus 3 víctimas, y Carlos tiene que elegir a 2. La probabilidad de que la primera que elija no sea ninguna de las elegidas por Antonio o Baldomero es de 2 / 5 = 0.4. La probabilidad de no pisarse con Antonio ni Baldomero con la segunda que elija es de 1 / 4 = 0.25. Es decir, la probabilidad de que Carlos elija a las dos pipiolas restantes,una vez han elegido Antonio (1 pipiola) y Baldomero (2 pipiolas) es de:

0.4 * 0.25 = 0.1

La probabilidad por tanto de que los tres escojan sin pisarse (dos de ellos escojan dos y uno de ellos escojan una) es de:

1 * 0.6 * 0.1 = 0.06

De la misma manera si tenemos 3 residentes mayores, y los tres eligen a una sola R1 de entre 5, la probabilidad de no pisarse sera:

1 * 0,8 * 0,6 = 0.48 ... y me sobran 2 R1 que no quiere nadie.

Si de los tres resis mayores, uno elige dos y los otros dos eligen una la probabilidad de no pisarse queda:

1 * 0.6 * 0.4 = 0.24 ... y quedaría una R1 que no querría nadie.


En resumen, la probabilidad dadas 5 R1 pipiolas de que no vayan dos o más a por alguna de ellas por puro azar:

Con 3 o más crápulas atacando a 2 cada uno de ellos: 0.0000 (es imposible)
Con 5 crápulas cada uno a por una (el peor de los casos): 0.0384
Con 3 crápulas, uno de ellos a por una y dos de ellos a por dos: 0.06
Con 3 crápulas, uno de ellos a por dos y dos de ellos a por una: 0.24
Con 3 crápulas, todos ellos a por una: 0.48
Con un solo 1 crápula para 5 pipiolas (por ejemplo el caso de Residente de Pediatría en el Hospital Niño Jesús que no sea homosexual, es decir un caso bastante improbable de por sí) la probabilidad de no tener competencia es del 100%, da igual que ataque a una o ataque a las cinco. Esa es la situación ideal.


Las asunciones para estos cálculos son dos:

- que lo que elige uno de los residentes crápulas no influye en lo que eligen los demás. Es decir que no hay colusión ni se reparten el botín como hienas.
- que no hay preferencias por unas R1 más que por otras, es decir que todas están igual de buenas (o son igual de feas) y además todas parecen igual de accesibles por lo que la probabilidad de que el crápula vaya a cualquier de ellas es la misma.

viernes, 7 de junio de 2013

Al Doctor Gavilán

 ¡Siiiiíganle muchachos!

domingo, 19 de mayo de 2013

Obreros de derechas

Escuchemos a uno de los médicos jubilados por Lasquetty, que se autoproclama de derechas y votante (bueno ex-votante) del PP mientras critica las políticas de privatización de Margaret Tatcher sin que se le mueva la corbata:



"que vaya por delante que yo soy de derechas y he votado al PP... hasta ahora"

Un ciudadano que votó a Esperanza Aguirre en 2011, y le dio la mayoría absoluta que ahora le permite a Lasquetty jubilarle a él.

Veamos lo que declaraba Esperanza Aguirre en una entrevista pública en El Pais justo antes de que este médico la votara:

"Como trabajador público de un hospital tambien público de gestión privada, ¿cuál es su política respecto a la escasa dotación de personal en la mayoría de hospitales y su progresiva privatización?
Que a los ciudadanos lo que les importa es que les curen sus enfermedades, les atiendan bien, les den la adecuada prevención y tengan las máximas comodidades. No les importa tanto si es o no funcionario el trabajador de un hospital."

"Hola Sra. Esperanza, ¿no considera usted injusto que empresas privadas se lucren y hagan negocio con el dinero de los impuestos de todos los Madrileños al gestionar éstos servicios públicos como la sanidad y la educación? Gracias.
¿Le parece a usted injusto que las empresas privadas se lucren con algo tan esencial como la alimentación, el vestido, la calefacción y la luz?"

Vamos a ver si nos enteramos. Si tienes que madrugar todos los días para ir a un trabajo da igual que ganes 1000€ o 5000€. Que lleves un mono de obra o una bata blanca. Eres un proletario, un currante, un obrero. Vives de vender tu fuerza de trabajo a cambio de un salario. Los ricos, los "capitalistas", viven de las rentas del capital. Entre otras cosas los ricos no tienen el problema de la "jubilación". Los ricos no se jubilan (aunque cobren una pensión si han cotizado). Siguen viviendo de las rentas de su capital después de los 65 años.

Y no hay nada más tonto que un obrero de derechas.

domingo, 12 de mayo de 2013

¿Qué juicio clínico le pongo al paciente?

La principal angustia a la que se enfrenta un R1 en sus primeras guardias se puede resumir en la duda existencial: "¿qué juicio clínico le pongo al paciente?".
 
Ola ke ase? me das de alta o ke ase?

Tanto para darle de alta, como para ingresarle, si el residente no es capaz de poner la etiqueta correcta se quedará bloqueado y las pegatinas de los pacientes pendientes de resolver se irán acumulando en su libreta.
Como ha estado 6 o 7 años estudiando enfermedades "de libro" al enfrentarse al paciente real, que tiene la jodida costumbre de no tener enfermedades de libro, no encuentra el término para "cerrar el caso". La respuesta no está en ninguna de las cinco opciones tipo test.
Con el paso del tiempo, y por imitación de sus residentes mayores o adjuntos, irá desarrollando toda una nueva taxonomía de términos diagnósticos apropiada a la realidad de la práctica médica: "sindrome constitucional a estudio", "mareo idiopático con exploración neurológica normal", "probable infección viral", "sobre-infección respiratoria"... o el concepto ontológico aglutinador de todas las altas para "control por su MAP": "sin patología urgente en el momento actual".
 
R1 de rayos aprendiendo a escurrir el bulto

Es curioso porque al médico sin experiencia le cuesta más encontrar el término diagnóstico que saber qué hacer con el paciente. Normalmente uno sabe qué hacer con el paciente, (aunque esté equivocado), pero en el abordaje terapéutico (¿qué hacer con el paciente?) no se da el fenómeno del "folio en blanco" que sí aparece en el etiquetado diagnóstico (¿qué tiene el paciente?).
La informatización de la historia clínica electrónica no hace sino complicar más las cosas, pues el estado actual de la tecnología fuerza, para hacer los datos explotables, a categorizar a los pacientes en taxonomías discretas, esto es, un conjunto de categorías con tres características: a) son mutuamente excluyentes, lo que complica el abordaje de las comorbilidades b) son binarias, es decir basadas en un paradigma probabilístico frecuentista (típico de la epidemiología) y no en uno bayesiano (más apto para la modelización de incertidumbres) y c) se supone son completas (lo que deja a los pacientes sin diagnóstico en tierra de nadie y les empuja a ir al homeópata).

¿Cuál es el problema de fondo? que los profesionales sanitarios durante su formación pregrado y postgrado no oyen nada de esto. Tú le hablas a un médico de ontologías, taxonomías, modelos de representación semántica y te mira como si fueras un extraterrestre. Sin embargo gran parte de su trabajo (y sus angustias) van a consistir en pelearse con modelos de representación semántica (etiquetas diagnósticas). Como no conoce la teoría, le pasarán un modelo desarrollado por otros y lo adoptará acríticamente (ya sea el CIAP, el CIE o el SNOMED-tecnología-propietaria-USA-con-licencia-cara-de-cojones-que-pagamos-todos-con-nuestros-impuestos). Bufará cuando tenga que encajar a sus pacientes reales en el modelo impuesto, como el que trata de encajar la última pieza de un puzzle mal resuelto dado puñetazos, y dirá que es que el programa informático es una mierda. 
 
¿cómo coño codifico "barro biliar"?

Por otra parte la formación del ingeniero informático está dominada por el paradigma de base de datos relacional (diseño de programas de gestión, tipo contabilidad, que es el 90% del nicho laboral) por lo que sobre tecnologías para el manejo de datos no estructurados (modelos de representación semántica, bases de datos NoSQL, minería de textos) tendrá como mucho alguna asignatura opcional. Vamos, que ni puta idea.

La tragedia está servida. Hay un conocimiento teórico necesario para solucionar el problema de "¿qué juicio clínico le pongo al paciente?". Por cierto, una pregunta incorrecta, pues lo correcto sería preguntar ¿cómo documento mi juicio clínico de modo que me permita tomar una decisión y de paso generar inteligencia sanitaria agregada?. Este conocimiento, por desgracia, queda relegado al campo de unos academicos-frikis-que-lo-flipas, que por supuesto nunca han pasado consulta con un paciente real y  que escriben artículos que solo se leen entre ellos
 
El profesor Grimer, gurú de las interfaces de terminología médica, en vez de pelis porno le pone comparar CIE-10 con DSMV.

Si alguien revisara el impacto que un interfaz de terminología clínica mal hecho tiene sobre los procesos clínicos y la salud pública a lo mejor nos llevábamos una sorpresilla.

sábado, 11 de mayo de 2013

Un paciente empoderado



Un paciente empoderado surafricano sufre amputación de dedos de mano derecha.

Contacta con un friki en USA, que no es médico ni nada y se ponen a diseñar una mano robótica.

Compran unas impresoras 3D, liberan el código y un montón de pacientes sin dedos empiezan a fabricarse sus propias prótesis:



Claro que las impresoras cuestan bastante pasta, aunque hay proyectos de hardware libre que permiten a cualquiera con un poco de paciencia construirse su propia impresora desde cero:



La pregunta es qué opinarán los protésicos de toda esta gente haciendose prótesis sin contar con un profesional, especialmente los protésicos dentales, un negocio especialmente lucrativo.

Imagino que lo mismo que los médicos sobre los pacientes que se automedican.

Hay mucho movimiento en este asunto, por ejemplo una máquina PCR para hacer experimentos genómicos que te puedes fabricar en tu casa.

Hay quien fabrica anfetaminas en el garaje, pero te meten en la cárcel, no sé que ocurriría si a alguien le da por fabricarse su propio ibuprofeno en casa.

Tiempos interesantes.

domingo, 28 de abril de 2013

Big Data, ¿Big Buzz?

El palabro "Big Data" está de moda. La cancamusa es un poco como los pantalones de campana, las hombreras o los pantalones lavados a la piedra. ¿Se acuerda? en su momento estaban muy de moda, aunque llevarlos ahora queda un tanto ridículo.

Lo mismo le ocurre al "dospuntocero", que ya ha quedado un poco "demodé". Lo de "la nube" también lleva el mismo camino. Pero no se preocupen, ha llegado la hora del "BigData" y empezarán a surgir gurús que darán conferencias sobre el tema y a escucharse mucho ruido en las revistas de negocios sobre el tema.

Recientemente en Forbes se hacen eco de una investigación donde se afirma que "google trends" es capaz de predecir si la bolsa va a subir o bajar.

Al margen de la posible discusión sobre si "google trends" es "web 2.0" o "big data" o "sustituyaseporlapalabrademodaentregurus" veamos qué hay detrás de todo este entusiasmo.

Los investigadores seleccionaron 96 palabras relacionadas con las finanzas y las monitorizaron diariamente viendo si la frecuencia con la que la gente las buscaba en google se correlacionaba con el hecho de que la bolsa bajara o subiera ese día.

Descubrieron que la palabra "debt" (deuda) les permitía alcanzar unas rentabilidades (en una simulación) de más del 300% si se aplicaba la siguiente regla: si el número de búsquedas ese día de la palabra "debt" sube, entonces vendes, y si baja, entonces compras. Bueno en realidad no era "vender", sino comprar warrants put o call, pero para los no financieros entiendasé como "vender/comprar".  Con una estrategia "aleatoria" del tipo lanzar una moneda al aire calcularon que hubiesen ganado un 16% en ese periodo. Usando la información sobre los millones de búsquedas que hace la gente en Google (el BigData) habían "ganado al mercado".

El titular es evidentemente sensacionalista. Veamos por qué.

Para darse cuenta de ello tampoco hay que ser un experto en estadística o epidemiología, basta aplicar una regla de sentido común financiero del estilo "nadie da duros a cuatro pesetas" que viene a decir que: "si alguien descubriese un método automático que le permitiese ganar dinero en bolsa no lo publicaría, lo usaría para ganar dinero en bolsa".

Pero vamos a ir un paso más allá para aprender un concepto que nos permitirá  desenmascarar a toda esa legión de gurús de medio pelo sin corbata que van a empezar a darnos charlitas sobre "big-data" con sus Prezis.

Existe en estadística el concepto del "valor de la p", que viene a ser algo así, de manera simple, como la probabilidad de encontrar una asociación cuando la asociación en realidad no existe.

De este modo, si yo detecto una asociación con una "p" del 5%, la interpretación es: "si no existiera una asociación entre el término "debt" y la evolución de la bolsa, hay una probabilidad del 5% de obtener estos datos por puro azar". O en otras palabras, "aunque en realidad no exista una asociación entre la palabra "debt" y la evolución de la bolsa, por cada 20 veces que repita este experimento, en una de esas repeticiones parecerá según los datos que existe realmente esa asociación".

Ahora imaginemos que en vez de repetir "20 veces el experimento" con la palabra "debt", lo que hacemos es escoger 20 palabras. Lo que ocurrirá es bastante similar, una de esas palabras podría dar una asociación por puro azar. Ampliemos el asunto a 96 palabras... las probabilidades de encontrar una palabra que en ese experimento se correlacionen con la evolución de las acciones de bolsa es más alto. De hecho si eligiesemos 1 millón de palabras seguramente encontraríamos alguna que adivinaría muy bien la evolución de la bolsa.... en el pasado.

El problema es que esa palabra del millón lo adivinaría muy bien en este experimento realizado sobre un periodo de tiempo, pero seguramente no en el próximo experimento en un periodo de tiempo futuro (porque se debe al puro azar). En el próximo experimento la palabra que prediga la evolución de la bolsa será otra de las 999.999 restantes. ¿Pero cuál?.

Cuando tienes un montón de datos para analizar y no tienes claro el método científico la tendencia es a analizar miles, sino millones de datos. Claro, al final siempre encuentras asociaciones "muy exactas". Lástima que se deban al puro azar y no puedan ser replicadas.

Esto ya ocurrió con lo del genoma humano. De pronto podíamos analizar cientos de miles de genes, y los investigadores se pusieron a buscar qué genes predecían qué enfermedades. Cada vez que hacían un experimento seleccionaban 10.000 variantes de genes y veían si los enfermos de Alzheimer las tenían  o no. Y siempre encontraban unas cuantas que se asociaban con el Alzheimer. Y salían en las noticias. Claro, luego otros investigadores repetían el experimento y los genes que les salían a ellos asociados al Alzheimer era otros diferentes. Y salían en las noticias también.

De modo que la próxima vez que un gurú del "Bigdata" les diga que han encontrado tal o cual asociación hágale dos preguntas capciosas:

- ¿cuántas variables ha analizado en total para encontrar esta asociación?
- ¿alguien ha replicado esta asociación en un experimento diferente?

Si el gurú les sale con evasivas y les habla del "paradigma disruptivo" pueden dejar de atenderle y ponerse a revisar el correo electrónico en su teléfono móvil. Con un valor p = 0.0000000000001 la charla del gurú de medio pelo será en realidad un montón de cancamusa maloliente.




martes, 23 de abril de 2013

Soy un Hiperfrecuentador

Muchos tertulianos y economistas de la salud afirman en ocasiones que en España la gente abusa de la sanidad pública. Para ello hacen referencia a datos como que el número medio de visitas al médico en España es superior (8.1 veces al año) que en Europa (5.6 veces).

Lo fácil, claro, es echar la culpa al paciente, que es un irresponsable y hasta nos hemos inventado un palabro para etiquetarlo: Hiperfrecuentador.

Pues bien, yo me he convertido en un hiperfrecuentador.




Mi mujer se ha quedado embarazada. Ya hemos tenido que hacer 5 visitas al centro de salud, todo para sacar unas analíticas de control:

Visita 1: "mire, que parece que estamos preñaos que a mi mujer no le viene
la regla y venimos para empezar con el seguimiento y a lo que nos manden"
... "no, mejor venid la semana que viene que es muy pronto y puede dar
falsos positivos"... salimos de allí y nos hicimos un predictor de esos que
confirmó lo que ya sabíamos.

Visita 2: "mire, que ya hemos hecho el test y está embarazada, ya llevamos
con el acfol y tal, por lo demás bien"... "vale, felicidades, os pido una
citología ¿?, toma este bote para la orina y pedid cita con la matrona por
la tarde y otro día para las analíticas por la mañana"

Visita 3 (a la matrona): "no se para qué te han pedido una citología, pasa
que te peso y te tomo la tensión... bueno, te voy a dar cita con el gine
para la primera eco, toma estos folletos, ya más adelante te daremos info
sobre los cursos de preparación y tal y pascual, no comas carne cruda, etc,
etc. A principios de junio pide otra cita conmigo"

Visita 4 (en ayunas): "aprieta el puño. Bueno, pide cita con tu médico para
los resultados en 10 días"

Visita 5 (para ver resultado de analíticas): "pues nada, que está todo
bien. ¿que tiene nauseas? pues primperan, toma la receta. Y otra de
acfol"...




A todo esto nadie le ha pedido un test de embarazo, se han fiado de nuestra
palabra aunque solo la segunda vez, no la primera.

Y eso que mi mujer NO ESTA ENFERMA, solo embarazada y somos de naturaleza
HIPOfrecuentadora.

Todo esto se tenía que resolver en una sola visita... ¿que dice usted que
está embarazada?... test de embarazo en orina si hay dudas y eco
transvaginal sobre la marcha (yo las he hecho, no es tan dificil), pase un
momentito a la enfermera que le va a tomar la tensión y a sacar unas
analíticas para las serologías, a última hora vienen a recogerlas para
mandarlas al laboratorio. Mañana en ayunas hágase una glucemia en la
farmacia antes de ir a trabajar, cuando pueda traiga un bote con la orina y
lo deja en la recepción con este volante y nos deja la glucemia que le
digan en la farmacia apuntada en esta hoja. Ya le llamaremos con los
resultados, en principio si todo está bien no tiene que venir hasta dentro
de 3 meses.

Pero nada, sigamos echando la culpa a los hiperfrecuentadores, que nos estropean los números.