miércoles, 12 de abril de 2023

Respuestas al curso Elementos de la IA " Módulo 3 "

 Odds

Tu tarea:

En el caso de los tres primeros elementos 1-3, convierte los odds en probabilidades expresadas como frecuencias naturales; por ejemplo, de 1:1 a 1/2. Da tu respuesta como fracción, por ejemplo, 2/3.

En el caso de los tres últimos elementos 4-6, convierte los odds en probabilidades expresadas como porcentajes (por ejemplo, 4,2 %). Da tu respuesta en forma de porcentaje con un solo decimal, por ejemplo, 12,2 %.

Pista: Los cálculos deben realizarse con una calculadora sencilla y las fórmulas pueden encontrarse más arriba.

El odds de sacar un trío en el póquer es de aproximadamente 1:46.

Tu respuesta:

5/8

La respuesta no es correcta.

Incorrecto. Hay 46 situaciones en las que no consigues un trío por cada una en la que sí, por lo que la probabilidad es 1/(1+46) = 1/47.

El odds de que llueva en Helsinki es de 206:159.

Tu respuesta:

7/11

La respuesta no es correcta.

Incorrecto. Hay 206 días lluviosos por cada 159 días secos, por lo que la probabilidad es 206/(206+159) = 206/365.

El odds de que llueva en San Diego es de 23:342.

Tu respuesta:

1/6

La respuesta no es correcta.

Incorrecto. Hay 23 días lluviosos por cada 342 días secos, por lo que la probabilidad es 23/(23+342) = 23/365.

El odds de sacar un trío en el póquer es de aproximadamente 1:46.

Tu respuesta:

2.1%

La respuesta es correcta.

Correcto. Antes, teníamos la probabilidad 1/(1+46) = 1/47, lo que equivale aproximadamente a 0,0213 y, redondeando, al 2,1 %.

El odds de que llueva en Helsinki es de 206:159.

Tu respuesta:

56.4%

La respuesta es correcta.

Correcto. Antes, teníamos la probabilidad 206/(206+159) = 206/365, lo que equivale aproximadamente a 0,5644 y, redondeando, al 56,4 %..

El odds de que llueva en San Diego es de 23:342.

Tu respuesta:

6.3%

La respuesta es correcta.

Correcto. Antes, teníamos la probabilidad 23/(23+342) = 23/365, lo que equivale aproximadamente a 0,0630 y, redondeando, al 6,3 %.


La regla de Bayes

EJERCICIO PARTE I

La respuesta correcta es 1854:159. El odds a priori es 206:159. La razón de verosimilitud es 9, por lo que el odds a posteriori de lluvia con nubes es 9 × 206:159 = 1854:159. A largo plazo, por tanto, en los días en que observemos nubes por la mañana, podemos esperar 1 854 días lluviosos por cada 159 días sin lluvia, lo que equivale aproximadamente a 12 días de lluvia por cada día sin lluvia. Si quisiésemos expresar esto en forma de probabilidad (aunque esta no era la pregunta), podríamos utilizar la fórmula x / (x+y) para obtener el valor 1854 / (1854+159), que es aproximadamente 0,92 o un 92 % de probabilidades de lluvia cuando hay nubes por la mañana. ¡Será mejor que lleves paraguas.

EJERCICIO PARTE 2 CANCER DE MAMA

 El odds a priori describe la situación antes de obtener el resultado de la prueba. Utilizando nuestros números inventados, si 5 de cada 100 mujeres tienen cáncer de mama, hay de media 5 mujeres con cáncer de mama por cada 95 mujeres sin cáncer de mama, y, por tanto, el odds a priori es 5:95. La razón de verosimilitud es la probabilidad de un resultado positivo en caso de cáncer dividida entre la probabilidad de un resultado positivo en caso de que no haya cáncer. Con los números anteriores, esta viene dada por 80/100 dividido entre 10/100, cuyo resultado es 8. A continuación, la regla de Bayes nos ofrece el odds a posteriori del cáncer de mama en vista del resultado positivo de la prueba: odds a posteriori = 8 × 5:95 = 40:95, que es la respuesta correcta. Así, a pesar del resultado positivo de la prueba, el odds está en contra de que la persona tenga cáncer de mama, ya que, entre las mujeres cuyo resultado de la prueba ha sido positivo, hay de media 40 mujeres con cáncer de mama por cada 95 mujeres sin cáncer de mama. Nota: Si quisiésemos expresar las posibilidades de cáncer de mama dado el resultado positivo de la prueba como una probabilidad (aunque no es lo que se pedía en el ejercicio), consideraríamos los 40 casos con cáncer y los 95 casos sin cáncer en conjunto, y calcularíamos qué parte del total de 40 + 95 = 135 personas tienen cáncer. Con ello, obtenemos como resultado 40 de 135, es decir, aproximadamente el 30 %. Esta cifra es muy superior a la prevalencia del cáncer de mama, 5 de cada 100, es decir, el 5 %, pero aun así hay posibilidades de que la persona no tenga cáncer. Si comparas la solución con la respuesta intuitiva, la mayoría de las veces suele ser bastante diferente. Esto demuestra lo poco adecuada que es nuestra intuición para tratar información incierta y contradictoria.

Clasificación bayesiana ingenua
Ejercicio 12: Filtro de correo no deseado de una palabra.

La respuesta correcta es 5,1. Como habrás podido darte cuenta, la estructura de este ejercicio es idéntica a la del ejercicio anterior sobre diagnóstico médico. Disponemos de la etiqueta de clase «correo no deseado» o «correo deseado», y un elemento de prueba que podemos utilizar para actualizar el odds a priori a fin de obtener el odds a posteriori. Antes decidimos que el odds a priori era 1:1. La razón de verosimilitud se obtiene dividiendo la probabilidad de la palabra «millón» en el correo no deseado entre la probabilidad de la palabra «millón» en el correo deseado. Ya calculamos esta cifra anteriormente, y puedes encontrarla en el cuadro de razones de verosimilitud: el valor es 5,1. Ahora, multiplica el odds a priori por la razón de verosimilitud para obtener 1:1 × 5,1 = 5,1. Este es el odds a posteriori. De nuevo, el odds a posteriori quiere decir que, en el caso de los mensajes que incluyan la palabra «millón», hay de media 5,1 mensajes no deseados por cada mensaje deseado. O para hablar en números enteros, hay 51 mensajes de correo no deseado por cada 10 mensajes deseados. El valor de la probabilidad es, por tanto, 51 / (51+10) = 51/61, es decir, aproximadamente el 83,6 %.

Ejercicio 13: Filtro de correo no deseado completo

La respuesta correcta es 65,1168. Comenzamos de la misma manera que en el ejercicio anterior. Al multiplicar el odds a priori por la razón de verosimilitud 5,1 (para la palabra «millón»), obtenemos un odds a posteriori de 5,1. A continuación, basta con que sigamos multiplicando el odds por las razones de verosimilitud correspondientes al resto del mensaje. Las razones de verosimilitud figuran en el cuadro anterior: 0,8 («dólares»), 53,2 («clic en el anuncio») y 0,3 («conferencia»). El producto de todos estos números es 1:1 × 5,1 × 0,8 × 53,2 × 0,3 = 65,1168. Esto quiere decir que, en el caso de los mensajes que incluyan estas cuatro palabras, habrá, de media, unos 65 mensajes de correo no deseado por cada mensaje deseado, es decir, 651 mensajes de correo no deseado por cada 10 mensajes deseados. Si quisiésemos obtener el valor de la probabilidad (cosa que no se pedía), este sería de aproximadamente 651 / (651+10) = 651 / 661, es decir, el 98,5 %. Este mensaje acabaría probablemente en tu carpeta de correo no deseado.


MÓDULO APRENDIZAJE AUTOMÁTICO

¿Cuál es el usuario más similar a Travis?


Al calcular las similitudes entre Travis y todos los demás usuarios, Ville y Travis tendrán la mayor similitud, con un valor de 3.

¿Cuál es la compra predicha para Travis?

Puesto que la última compra de Ville fue protector solar, también se lo recomendaremos a Travis.

Ejercicio 15: Burbujas de filtro

Como hemos visto, recomendar noticias o contenidos de redes sociales porque probablemente le vayan a gustar a un usuario o este vaya a hacer clic en ellos puede dar lugar a burbujas de filtro con las que los usuarios solo vean el contenido que se ajuste a sus propios valores y opiniones.

¿Crees que las burbujas de filtro son perjudiciales? Al fin y al cabo, se crean a partir de la recomendación de contenidos que le gustan al usuario. ¿Qué consecuencias negativas, si es que las hay, podrían asociarse a las burbujas de filtro? No dudes en buscar más información en otras fuentes.
Piensa en formas de evitar las burbujas de filtro sin perder la capacidad de recomendar contenidos que se adapten a las preferencias personales. Propón por lo menos una sugerencia. Puedes buscar ideas en otras fuentes, pero también nos gustaría conocer tus propias ideas.
Nota: Tu respuesta debe consistir en unas cuantas frases por lo menos para cada parte.

RESPUESTA:

Las burbujas de filtro pueden ser perjudiciales ya que pueden limitar la exposición del usuario a diferentes perspectivas y opiniones, lo que puede reforzar sus prejuicios y fomentar la polarización. Además, las burbujas de filtro pueden reducir la calidad y la diversidad de los contenidos que reciben los usuarios, ya que solo se recomiendan contenidos similares a los que ya han consumido.

Para evitar las burbujas de filtro, una posible solución es fomentar la diversidad de fuentes de información y perspectivas en las recomendaciones de contenidos. Por ejemplo, en lugar de recomendar contenidos enfriados únicamente en las preferencias pasadas del usuario, se podrían incluir recomendaciones de contenidos que representan diferentes puntos de vista y enfoques. También se podría permitir que los usuarios modifiquen manualmente sus preferencias para incluir una mayor variedad de contenidos

Regresión
Ejercicio 16: Regresión lineal

A

 A: 80 - 5 + 6 = 81

B

 80 - 8 + 1 = 73

C

Tu respuesta:
84


La respuesta es correcta.

Correcto. 80 + 4 = 84

Ejercicio 17: Esperanza de vida y formación (parte 1 de 2) RESPUESTA

Los escasos puntos de datos de que disponemos impiden decir prácticamente nada sobre la esperanza de vida basándonos únicamente en los datos. Obviamente, es posible saber mucho sobre esperanza de vida a partir de otras fuentes, pero los datos del anterior gráfico no son suficientes para ello. Así pues, la primera opción es claramente excesiva. Aunque los intervalos de las opciones dos y tres sean probablemente válidos, la expresión «con seguridad» hace que no estén justificados. Hay una posibilidad, superior a cero, de que el valor resulte ser, por ejemplo, mayor de 70. Por tanto, la única opción que nos sirve es la cuarta.

Ejercicio 18: Esperanza de vida y formación (parte 2 de 2)

La primera opción sería claramente extraña, ya que los datos muestran que muy pocos países tienen una esperanza de vida inferior a 50 años, y ninguno de los puntos de datos con más de 12 años de formación se sitúa por debajo de 50. Por supuesto, no podemos estar seguros, pero una esperanza de vida de entre 45 y 50 años sería verdaderamente sorprendente. La segunda opción es correcta porque se ajusta a la tendencia general, y todos los puntos de datos con más de 12 años de formación se sitúan dentro de este intervalo. El intervalo de 69 a 71 años de la tercera opción podría incluir perfectamente el valor real, pero, con los datos anteriores, sería demasiado atrevido afirmar que se conoce el resultado con tanta precisión. El intervalo de 15 a 150 años de la cuarta opción incluiría, prácticamente con total seguridad, el valor real, pero es tan vago que creemos que sería un resumen deficiente de lo que podemos aprender a partir de los datos.

Ejercicio 19: Regresión logística

La respuesta es correcta

Correcto. Las tres primeras respuestas equivalen, respectivamente, a una probabilidad aproximada de aprobar del 30, el 50 y el 70 %. Para tener una probabilidad del 80 % de aprobar, deberías estudiar unas 10-11 horas.



No hay comentarios:

Publicar un comentario

loading...