La cola escarpada

Estaba preparando unas transparencias para la IMAD 2.0 en Palma e hice la gráfica de las noticias publicadas desde el principio del Menéame agrupadas por sitios o blogs.

El resultado está en la imagen de abajo. Se puede observar que es una long tail, pero con un pico bastante escarpado y una cola muy larga (el gráfico está podado por la parte superior).

Menéame long tail

Al momento de sacar las estadísticas había 26121 noticias publicadas, de 8077 blogs o sitios diferentes.

Me llamó la atención esa curva, así que miré por dónde estaba el 50%, así obtuve que el 50% de las noticias publicadas corresponden a las primeras 250 posiciones, que incluyen hasta las que tienen 12 noticias publicadas. En la tabla de abajo está la lista de los 250 primeros (también se puede ver la «nube» de esos datos actualizado en tiempo real).

La reflexión y algunas conclusiones… para la conferencia y/o mi blog personal. Todavía no tengo idea 🙂

Actualización: de los 250 primeros sitios, 164 (66%) son blogs o publicaciones digitales no ligados a medios tradicionales. Del total de 13.084 noticias publicadas de esos sitios, 5.929 (45%) corresponden a esos blogs o sitios. No es para festejar, pero tampoco está nada mal, sobre todo teniendo en cuenta que el resto del 50% de la cola tendrán una proporción mayor de blogs. Quizás sólo se trate de whishful thinking, pero no tengo la voluntad suficiente para clasificar casi 8.000 urls diferentes. Si hay un voluntario, puede bajarse la lista completa de noticias publicadas por sitios (230 KB).

Segunda actualización: Fernand0 analiza la curva.

Pos URL Publicadas
1 http://www.elpais.com 1007
2 http://www.20minutos.es 899
3 http://www.elmundo.es 802
4 http://www.youtube.com 411
5 http://www.elpais.es 356
6 http://www.lavanguardia.es 343
7 http://www.cadenaser.com 284
8 http://actualidad.terra.es 237
9 http://www.elperiodico.com 229
10 http://www.abc.es 190
11 http://www.lavozdegalicia.es 188
12 http://www.europapress.es 183
13 http://www.kriptopolis.org 166
14 http://news.bbc.co.uk 154
15 http://www.elplural.com 146
16 http://es.theinquirer.net 139
17 http://www.escolar.net 134
18 http://barrapunto.com 127
19 http://www.internautas.org 121
20 http://www.elconfidencial.com 120
21 http://blogs.periodistadigital.com 96
22 http://www.astroseti.org 95
23 http://es.noticias.yahoo.com 94
24 http://www.microsiervos.com 91
25 http://es.news.yahoo.com 88
26 http://es.wikipedia.org 88
27 http://www.adslzone.net 87
28 http://www.rebelion.org 85
29 http://www.libertaddigital.com 82
30 http://www.flickr.com 82
31 http://www.kaosenlared.net 79
32 http://www.consumer.es 75
33 http://google.dirson.com 74
34 http://www.levante-emv.com 74
35 http://www.bandaancha.st 74
36 http://www.larepublica.es 73
37 http://www.informativos.telecinco.es 72
38 http://www.eleconomista.es 71
39 http://86400.es 68
40 http://www.genbeta.com 67
41 http://www.larazon.es 67
42 http://mangasverdes.es 66
43 http://www.adn.es 65
44 http://www.cincodias.com 63
45 http://www.laflecha.net 63
46 http://mnm.uib.es/gallir 62
47 http://www.clarin.com 61
48 http://www.publico.es 61
49 http://fogonazos.blogspot.com 60
50 http://www.bottup.com 59
51 http://www.filmica.com/david_bravo 59
52 http://www.tendencias21.net 59
53 http://www.electronicafacil.net 57
54 http://alt1040.com 55
55 http://www.lne.es 53
56 http://www.marca.com 52
57 http://www.theinquirer.es 51
58 http://es.today.reuters.com 50
59 http://video.google.com 48
60 http://www.eluniversal.com.mx 48
61 http://www.infobae.com 47
62 http://www.diarioti.com 45
63 http://news.yahoo.com 44
64 http://www.anfrix.com 43
65 http://www.maikelnai.es 43
66 http://news.com.com 42
67 http://www.novaciencia.com 42
68 http://www.abadiadigital.com 41
69 http://www.as.com 41
70 http://www.canarias7.es 41
71 http://www.diarioadn.com 40
72 http://en.wikipedia.org 39
73 http://xataka.com 39
74 http://edans.blogspot.com 39
75 http://www2.noticiasdot.com 38
76 http://es.youtube.com 38
77 http://www.expansion.com 38
78 http://www.nodo50.org 36
79 http://curiosoperoinutil.com 36
80 http://www.invertia.com 35
81 http://iblnews.com 35
82 http://www.cnn.com 34
83 http://www.formulatv.com 33
84 http://www.wired.com 33
85 http://www.hispamp3.com 33
86 http://www.univision.com 32
87 http://www.diarioinformacion.com 32
88 http://javimoya.com/blog 31
89 http://arstechnica.com 31
90 http://mundogeek.net 31
91 http://www.diariosur.es 31
92 http://www.elcorreogallego.es 30
93 http://www.elcorreodigital.com 30
94 http://www.elconfidencialdigital.com 30
95 http://sp.rian.ru 30
96 http://www.vivalinux.com.ar 29
97 http://www.metacafe.com 29
98 http://desvariandoando.blogspot.com 29
99 http://www.nytimes.com 29
100 http://www.lanacion.com.ar 28
101 http://www.farodevigo.es 28
102 http://www.genciencia.com 28
103 http://www.theregister.co.uk 28
104 http://www.boingboing.net 28
105 http://www.heraldo.es 27
106 http://sigt.net 27
107 http://www.google.com 26
108 http://www.dailymail.co.uk 26
109 http://www.tecnorantes.com 25
110 http://www.elsemanaldigital.com 25
111 http://www.diariodeleon.es 25
112 http://torrentfreak.com 24
113 http://www.elcorreodigital.com/vizcaya 24
114 http://eliax.com 24
115 http://www.error500.net 24
116 http://www.diariodemallorca.es 24
117 http://www.ideal.es/granada 23
118 http://www.elblogsalmon.com 23
119 http://www.jornada.unam.mx 23
120 http://www.burbuja.info 23
121 http://spanish.martinvarsavsky.net 23
122 http://www.sclipo.com 23
123 http://www.hoy.es 23
124 http://www.xlsemanal.com 23
125 http://www.milenio.com/ 22
126 http://weblog.topopardo.com 22
127 http://halondisparado.com 22
128 http://www.baquia.com 22
129 http://www.eitb24.com 22
130 http://www.neoteo.com 22
131 http://www.lahaine.org 22
132 http://miajadas.blogspot.com 22
133 http://yro.slashdot.org 21
134 http://www.timesonline.co.uk 21
135 http://www.elotrolado.net 21
136 http://www.physorg.com 21
137 http://www.nortecastilla.es 21
138 http://www.noticias24.com 20
139 http://periodismoincendiario.blogspot.com 20
140 http://www.hispanidad.com 20
141 http://www.nopuedocreer.com 20
142 http://oclcyc.wordpress.com 20
143 http://www.washingtonpost.com 20
144 http://www.livescience.com 20
145 http://personales.ya.com/josumezo 20
146 http://www.lacoctelera.com/yaestaellistoquetodolosabe 19
147 http://lacomunidad.elpais.com/lml 19
148 http://neofronteras.com 19
149 http://www.blogs.telecinco.es 19
150 http://www.theinquirer.net 19
151 http://elnuevoherald.com 19
152 http://loretahur.blogspot.com 19
153 http://www.motorpasion.com 19
154 http://www.alpoma.net 19
155 http://www.diariovasco.com 18
156 http://www.vnunet.es 18
157 http://www.vayatele.com 18
158 http://www.ecologistasenaccion.org 18
159 http://www.kirainet.com 18
160 http://rinzewind.org 18
161 http://noticias.ya.com 18
162 http://www.ison21.es 18
163 http://www.ideal.es 18
164 http://personales.ya.com 18
165 http://www.facua.org 17
166 http://www.hispasec.com 17
167 http://www.dw-world.de 17
168 http://www.anieto2k.com 17
169 http://periodistas21.blogspot.com 17
170 http://antwrp.gsfc.nasa.gov 17
171 http://www.cienciakanija.com 17
172 http://www.fayerwayer.com 17
173 http://www.chilehardware.com 17
174 http://www.lasprovincias.es/valencia 17
175 http://www.gara.net 17
176 http://medtempus.com 17
177 http://sevilla.abc.es 16
178 http://axxon.com.ar 16
179 http://www.enriquedans.com 16
180 http://www.europapress.com 16
181 http://digg.com 16
182 http://noticias.ozu.es 16
183 http://www.uberbin.net 16
184 http://knuttz.net 16
185 http://www.eldiariomontanes.es 16
186 http://lta.today.reuters.com 16
187 http://www.unionradio.com.ve 16
188 http://englishrussia.com 16
189 http://www.noticiasdot.com 16
190 http://www.kbglob.com 16
191 http://www.elgranpoder.com 15
192 http://blog.smaldone.com.ar 15
193 http://spanish.jabatonet.com 15
194 http://www.aporrea.org 15
195 http://www.vidaextra.com 15
196 http://www.guardian.co.uk 15
197 http://www.elperiodicodearagon.com 15
198 http://www.ionlitio.com 15
199 http://www.eljueves.es 15
200 http://www.noticiastech.com 15
201 http://www.fentlinux.com 15
202 http://cesar.lasideas.es 15
203 http://www.online.com.es 15
204 http://www.linux.com 15
205 http://www.eltiempo.com 15
206 http://www.elcolombiano.com.co 15
207 http://rinconmarginado.blogspot.com 15
208 http://www.ovejaselectricas.es 15
209 http://www.desktoplinux.com 15
210 http://www.meristation.com 15
211 http://www.diagonalperiodico.net 14
212 http://www.finanzas.com 14
213 http://www.com.es 14
214 http://www-128.ibm.com 14
215 http://www.madrimasd.org 14
216 http://www.diariodenavarra.es 14
217 http://www.tuexperto.com 14
218 http://malaciencia.blogspot.com 14
219 http://www.techtear.com 14
220 http://www.noticias3d.com 14
221 http://www.granadadigital.com 14
222 http://www.emezeta.com 14
223 http://erenovable.com 14
224 http://blog.faqoff.org 14
225 http://www.derecho-internet.org 14
226 http://www.vertele.com 14
227 http://www.microsoft.com 13
228 http://www.lapastillaroja.net 13
229 http://www.diariometro.es 13
230 http://www.voltairenet.org 13
231 http://www.ambienteg.com 13
232 http://www.cotizalia.com 13
233 http://jasp.bitacoras.com 13
234 http://kirai.bitacoras.com 13
235 http://rcda.wordpress.com 13
236 http://www.elcomerciodigital.com 13
237 http://blogs.20minutos.es/retiario 13
238 http://www.geocities.com 13
239 http://www.nasa.gov 13
240 http://www.google.es 13
241 http://www.negocios.com 13
242 http://www.informationweek.com 13
243 http://www.neatorama.com 13
244 http://blog.meneame.net 13
245 http://www.desdeguate.com/blog 12
246 http://algasa.blogspot.com 12
247 http://www.treehugger.com 12
248 http://blogs.elcorreodigital.com 12
249 http://www.osnews.com 12
250 http://www.emol.com 12