Skip to main content

Ralsina.Me — Roberto Alsina's website

8 de cada 10 gatos prefieren whiskas (o: como mentir con estadísticas)

DIS­CLAIMER: Uso Whiskas porque tenía un slo­gan es­tadís­ti­co. No ten­go na­da con­tra Whiskas. ¡A mis gatos les gus­ta Whiskas! No me ha­ga juicio señor Whiskas :-)

Ese es (o er­a) el slo­gan de Whiskas. Que debe ser ri­co si sos un gato (ad­mi­to que las latas hue­len apeti­tosas) per­o... en se­ri­o, 8 de ca­da 10? Bueno, re­sul­ta que de­spués aclararon "8 de ca­da 10 dueños de gatos que ex­pre­saron una pref­er­en­cia di­jeron que sus gatos pre­fieren whiskas".

No es tan mar­ketinero.

Bueno, en este post va­mos a ver otras man­eras de hac­er que 8 de ca­da 10 gatos pre­fier­an al­go. Hay una sor­pren­dente can­ti­dad de for­mas de hac­er­lo! Voy a mostrar ejem­p­los ex­tremos, para que se en­tien­da la téc­ni­ca. De aquí en más, ust­edes son gatos y yo tra­ba­jo en el de­par­ta­mente de mar­ket­ing es­tadís­ti­co de Whiskas.

Pregunta Tendenciosa

Nun­ca con­fíes en una en­cues­ta que no te dice ex­ac­ta­mente qué pre­gun­taron. Por ejem­plo, qué re­spon­derías si te pre­gun­to "¿S­r. gato, pre­fiere whiskas o la leucemia fe­li­na?". Des­de ya que una pre­gun­ta tan ten­den­ciosa, que com­para cosas to­tal­mente dis­tin­tas, tiene una so­la re­spues­ta lóg­i­ca, lo que garan­ti­za el re­sul­ta­do.

Tam­bién es un ejem­p­lo de la fala­cia de la fal­sa di­co­tomía, y es­tá buenísi­mo, porque sig­nifi­ca que uno puede ten­er un laburo renta­do en base a aprovechar esa clase de lóg­i­ca clási­ca que pen­saron que no servía para na­da.

Ejem­p­los al­ter­na­tivos:

¿Whiskas o comida hecha con cabezas de pescado y aditivos?

Whiskas tal vez tam­bién es­tá he­cho de cabezas de pesca­do y adi­tivos.

¿Whiskas o Kitekat?

Puse Kitekat co­mo po­dría haber puesto cualquier mar­ca bara­ta. La gente (y los gatos, cuan­do en re­al­i­dad le pre­gun­tás a los dueños) tiende a ele­gir la mar­ca cara, es­pe­cial­mente cuan­do es una elec­ción que no le cues­ta dinero. Suele acom­pañarse de una no­ta al pie en le­tra dimin­u­ta que dice cosas co­mo "pre­fiere whiskas com­para­do con mar­cas rep­re­sen­ta­ti­vas de la com­pe­ten­cia en el mer­cado"

Co­mo "rep­re­sen­ta­ti­vas" y "el mer­cado" son cosas com­ple­ta­mente in­definidas, es muy prob­a­ble que quiera de­cir "mar­cas con las cuales nos da un lin­do número a fa­vor".

El dis­eño de las pre­gun­tas es una parte muy im­por­tante del hac­er en­cues­tas. Cosas co­mo cual nom­bre se pone primero varía el re­sul­ta­do (pis­ta: whiskas va siem­pre primero ;-)

Experimentos Informales

En vez de pre­gun­tar­le a los dueños, pre­gun­té­mosle a los gatos ¡CIEN­CI­A! Ponemos un bol de whiskas y otro de otra mar­ca, solta­mos un gato y ve­mos que come. ¿Sue­na bi­en?

Bueno, sí, sue­na bi­en siem­pre que con­troles las vari­ables que no son "mar­ca de co­mi­da".

Por ejem­p­lo (y créan­me, fal­tan cien­tos):

¿Los gatos tienen ten­den­cia a preferir co­mi­da a la que es­tán acos­tum­bra­dos?

¿De ser así, los gatos del ex­per­i­men­to comían whiskas?

¿Se usa el mis­mo sa­bor de co­mi­da en am­bos bol­s?

¿Se usa la mis­ma can­ti­dad?

¿Se pone whiskas aleato­ri­a­mente a la derecha y a la izquier­da?

¿El gato se ubi­ca a la mis­ma dis­tan­cia de am­bos bol­s?

¿El gato en­tró al área de prue­ba sin pasar cer­ca de uno de los bol­s?

¿La raza del gato afec­ta la pref­er­en­ci­a?

¿Son gatos con una di­eta rep­re­sen­ta­ti­va de la población de gatos?

¿Son gatos de razas rep­re­sen­ta­ti­vas de la población?

¿Los dueños de los gatos los ll­e­van, o son gatos de refu­gio? ¿Si los ll­e­van los dueños, có­mo se los re­clu­ta?

¿Cual es la edad de los gatos? ¿Es rep­re­sen­ta­ti­va?

Etc, etc, etc.

¿Y por supuesto... hay un in­terés en el que ll­e­va a cabo el ex­per­i­men­to que ha­ga que pre­fiera un re­sul­ta­do pos­i­ti­vo para Whiskas?

El dis­eño ex­per­i­men­tal es una cien­ci­a. Y es una cien­cia muy difí­cil. Sospe­cho que el de­par­ta­men­to de mar­ket­ing de Whiskas no cumple los stan­dard­s.

Agrupar Resultados

Es­ta es muy us­a­da en en­cues­tas políti­cas, gen­eral­mente las de "im­a­gen pos­i­ti­va".

Supong­amos que les ha­go una en­cues­ta mul­ti­ple choice:

¿Qué le parece la cal­i­dad de Whiskas?

  1. Ex­ce­­lente

  2. Asom­brosa

  3. In­­creíble

  4. Muy bue­­na

  5. Bue­­na

  6. Hor­ri­ble

A menos que te parez­ca real­mente hor­ri­ble (y co­mo lo vas a saber, no sos gato), vas a con­tes­tar al­go pos­i­tivo, y Whiskas puede de­cir que tiene una im­a­gen pos­i­ti­va del 90%. Veamos una al­ter­na­ti­va, con un­os re­sul­ta­dos que acabo de in­ven­tar:

  1. Muy bue­­na (10%)

  2. Bue­­na (20%)

  3. Nor­­mal (50%)

  4. Mala (10%)

  5. Muy mala (10%)

¿Parece más bal­anceada, no? Sí, lo es, pero de­spués se toman las 3 cat­e­gorías de ar­ri­ba co­mo "bue­nas" y só­lo las dos de aba­jo co­mo malas, y el re­sul­ta­do puede ser al­go co­mo "80% de los en­cues­ta­dos opina que Whiskas es de cal­i­dad acept­able o mejor que la me­di­a". O, si te pa­ga Kitekat: "70% de los en­cues­ta­dos opina que Whiskas es de una cal­i­dad medi­ocre o in­fe­ri­or que la me­di­a". Y las dos cosas son cier­tas.

Descarte de Negativos

Supong­amos que dis­eñamos un ex­per­i­men­to per­fec­to. Supong­amos por otro la­do que los gatos, la ver­dad, comen cualquier cosa. Que es cier­to... en mi casa los gatos comen cu­carachas aún con un bol de whiskas disponible en la coci­na. Eso in­di­caría que van a ele­gir más o menos al azar. En­tonces a ve­ces van a ele­gir más Whiskas, y a ve­ces van a ele­gir la al­ter­na­ti­va.

A ve­ces mu­cho, a ve­ces poco.

En­ton­ces, al­can­za con repe­tir el ex­per­i­men­to lo su­fi­ciente... y no de­cir­le a nadie cuan­do no nos con­viene. En­ton­ces, si de 23 ve­ces que hice el ex­per­i­men­to 1 vez 8 gatos eligieron Whiskas... sale slo­gan. Claro, no voy a de­cir "8 de ca­da diez gatos pre­fieren whiskas 1 de ca­da 23 ve­ces de acuer­do a mis prue­bas" porque no en­tra en los carte­les.

Es­to pare­cerá muy ton­to, pero es o que ha­cen, por ejem­plo, las far­ma­céu­ti­cas. Nun­ca pub­li­can los re­sul­ta­dos de los es­tu­dios neg­a­tivos. Sí, la ex­cusa es "de que sirve un es­tu­dio que dice que la as­pi­ri­na no cu­ra la der­mati­tis". Bueno, para em­pezar evi­ta que la otra far­ma­céu­ti­ca in­ves­tigue lo mis­mo. Y por otro lado, si el día de mañana al­guien em­pieza a vender as­pi­ri­na para la der­mati­tis porque tiene un es­tu­dio pos­i­ti­vo... bueno, se puede hac­er un metaes­tu­dio y ver si es cier­to.

Y porque saber más es casi siem­pre bueno. Y aho­ra sabés que las en­cues­tas... bueno, las en­cues­tas no siem­pre son lo que te di­cen.

Porcentajes Mentirosos

Supong­amos que se hace, ca­da X años una eval­u­ación del es­ta­do de la ed­u­cación en mu­chos país­es. Supong­amos que se lla­ma PISA, y los re­sul­ta­dos son públi­cos, y se hi­zo en 2000, 2003, 2006, 2009 y 2012.

Supong­amos además que los re­sul­ta­dos en matemáti­ca fueron es­tos:

  • 2012: 388

  • 2009: 398

  • 2006: 381

O sea una variación de -10 pun­tos en esa es­cala en­tre 2009 y 2012. Ob­vi­a­mente eso ll­e­va a tit­u­lares catástrofe ac­er­ca de la deca­den­cia de la ed­u­cación ar­genti­na, es­pe­cial­mente porque otros país­es de la región tu­vieron mejores re­sul­ta­dos (que ob­vi­a­mente ig­no­ran el re­sul­ta­do de 2006). Pero ... bueno, si sabés de mi his­to­ria con es­ta clase de cosas sabés que hay un per­o.

Re­sul­ta que eso que ves no es real­mente el in­forme "o­fi­cial". Es el press re­lease, que parece más la tabla de un tor­neo de fút­bol que un re­porte es­tadís­ti­co o so­ci­ológi­co. El re­porte ofi­cial es ... más com­pli­ca­do. Por ejem­plo, con­tiene cosas co­mo que los alum­nos de Ar­genti­na tienen una mucha may­or per­cep­ción de que sacar bue­nas no­tas en cien­cias es im­por­tante que los de Ale­ma­nia (90% a 77%) pero no nos meta­mos a ver las mil tablas de ca­da re­porte. Sig­amos con los pun­ti­tos.

Por ejem­plo, acá es­tá lo que dice el re­porte ofi­cial de Ar­genti­na en 2009 en matemáti­ca:

  • Se­­cun­­daria reg­u­lar: 421

  • Resto mues­­tra: 337

  • To­­tal mues­­tra: 388

¿Qué es es­o? "Se­cun­daria reg­u­lar" quiere de­cir "alu­mos de se­cun­dari­ade 15 años". El "resto mues­tra" es gente que no es alum­na del gra­do es­co­lar es­per­a­ble, porque aban­donó los es­tu­dios tem­po­ral­mente, o repi­tió, o es­tá atrasa­do por al­gún otro mo­ti­vo. El "to­tal" es un prome­dio de to­da la mues­tra.

En­tonces re­sul­ta que ese número mági­co subió del 2006 al 2009 17 pun­tos y ba­jó luego 10 pun­tos del 2009 al 2012. Les di­je que el re­porte orig­i­nal es mu­cho más com­pli­ca­do. Una de esas com­pli­ca­ciones es que tra­ta de in­dicar si las difer­en­cias son es­tadís­ti­ca­mente sig­ni­fica­ti­vas o no. Es com­pli­ca­do de ex­pli­car, pero siem­pre cuan­do medís una cosa com­pli­ca­da co­mo es­ta, hay varia­ciones en cuan­to te da. Siem­pre. En­ton­ces, hay que tratar de dis­tin­guir en­tre esa variación nat­u­ral y azarosa y una ten­den­cia re­al. Hay tests matemáti­cos para ten­er una idea.

En este ca­so, dice que los val­ores son es­tadís­ti­ca­mente sig­ni­fica­tivos al 5% para difer­en­cias de mas o menos 9 pun­tos. La os­cila­cion ar­genti­na en­tre 2009 y 2012 es­tá al bor­de de no ser sig­ni­fica­ti­va. Es ex­pli­ca­ble en un 80% por rui­do en la medi­ción.

Por otro la­do... ¿S­aben quienes no es­tán me­di­dos? Los que no van al cole­gio.

En­ton­ces, hay una man­era muy sen­cil­la de subir los pun­ta­jes. Hacé que vaya menos gente al se­cun­dari­o. Hacé que en vez de repe­tir aban­do­nen.

En Ar­genti­na, re­sul­ta que des­de 2006 a 2012 el por­centa­je de ado­les­centes de 15 que va al cole­gio no es con­stante. No ten­go el da­to ex­ac­to porque no se cat­e­go­riza por edad, pero en 1971, en la época que los viejos co­mo yo ex­trañan co­mo una edad de oro (porque so­mos viejos y bolu­dos) el por­centa­je de población es­co­lar­iza­da era 63.4% y en 2012 era del 90.9%

La can­ti­dad de alum­nos se­cun­dar­ios en Ar­genti­na (y re­cuer­den que al­gunos de los del PISA son de pri­mari­a, repi­ten­tes, etc) subió en­tre 2007 y 2012 de 11,262,362 a 12,108,740 (7.5%). En par­tic­u­lar, en el se­cun­dar­i­o, subió de 3,471,738 a 3,813,545 (9,85%).

Ten­dría que cor­rela­cionarlo con las tablas de nacimien­tos y no pien­so ca­len­tarme en hac­er­lo, pero que au­mente más el se­cun­dario que el pri­mario en un país con población en crec­imien­to y es­co­lar­ización pri­maria casi ple­na in­di­ca que la es­co­lar­ización se­cun­daria subió mu­cho. No un poco. mu­cho.

Y sí, uno de los efec­tos de agre­gar gente antes ex­cluí­da al uni­ver­so que mide PISA es que los números ba­jan. Y eso no es­tá mal.

Fixing HDMI overscan on Ubuntu again

A while ago, I wrote about us­ing a cheap 1080p TV as ex­ter­nal mon­i­tor on Ubun­tu. That hap­pens to cause some weird prob­lems be­cause the TV is try­ing to be smart about clip­ping things, etc (just read it if you wan­t.)

In it I out­lined a bunch of ap­proach­es that suc­ceed in fix­ing over­scan with dif­fer­ent lev­els of suc­cess. Here's some ex­tra de­tail for one of those, set­ting up a cus­tom mode which does­n't trig­ger over­scan:

First, go to http://www.arach­noid.­com/­mod­e­li­nes/ and cre­ate a mod­e­line for some mode that is close to 1080p but not quite there. How close to 1080p you can get be­fore your TV de­cides "this is 1080p I am do­ing over­scan" will vary.

For ex­am­ple, I can do 1800x1012 with this mod­e­line and can prob­a­bly do a bit more:

Modeline "1800x1012_60.00" 151.42 1800 1912 2104 2408 1012 1013 1016 1048 -HSync +Vsync

Then, to ex­per­i­men­t, we can add this mode to X us­ing xran­dr. Here HD­MI1 is the out­put I have con­nect­ed to my TV:

xrandr --newmode "1800x1012_60.00" 151.42 1800 1912 2104 2408 1012 1013 1016 1048 -HSync +Vsync
xrandr --addmode HDMI1 "1800x1012_60.00"
xrandr --output HDMI1 --mode "1800x1012_60.00"

I don't think it works as well as the force-d­vi hack from the last time, but hey, I do get HD­MI au­dio, and I have not seen this de­scribed else­where us­ing xran­dr.

The Book of Basketball: The NBA According to The Sports Guy

Cover for The Book of Basketball: The NBA According to The Sports Guy

Review:

What's good about this book is the same that's bad about it. It's a col­lec­tion of the prej­u­dices, knee­jerk re­ac­tions and home­risms of Bill Sim­mons when dis­cussing a sub­ject he re­al­ly is pas­sion­ate about, the NBA.

I would pre­fer he spend his time in­ter­view­ing re­tired play­ers (his Wal­ton chap­ter is awe­some, as is a long ar­ti­cle about Bill Rus­sell he did ear­li­er this year) than or­der­ing dis­parate and in­com­pa­ra­ble things (be­cause how can Bowie-over-Jor­dan and Wal­ton's feet be in the same list in any or­der?)

In any case, it's clear­ly a labour of love and foot­notes, and I like both things.


Contents © 2000-2023 Roberto Alsina