28 şubat 2016 istatistik rezaleti

  • aslında rezaletlerin istatistiğidir.

    sözlükte bol miktarda bulunan rezaletleri bi toparlamak gerekiyor artık. bunun için bir excel dosyası hazırladım.

    biraz pratik yapma amacıyla verileri okumak için power query kullandım. alınan datayı modellemek için ise power pivot'tan yararlandım.

    istatistiklere geçmeden önce uyguladığım standardı belirteyim:
    - başlığın mutlaka tarih ile başlaması gerekiyor. d mmmm yyyy formatında olmalı. bu formata uymayan bazı tarihleri elimden geldiğince düzenlemeye çalıştım. mesela 22-23 haziran 2016 hede hödö rezaleti başlığını aldım ama haziran 2016 falan filan rezaleti'ni almadım.
    - başlığın mutlaka rezaleti ifadesiyle bitmesi gerekiyor.
    - bu ikisinin arasındaki ifadeyi rezil olarak aldım. yalnız 4 tane rezili olmayan rezalet başlığı var.

    bir not daha belirteyim. bazı başlıkların ilk entry'leri uçmuş. yapacak bir şey yok. elimizdeki verilerle analiz yaptık. bazı hatalı yazımlardan dolayı çoklanmış başlıklar da var. idare edersiniz artık.

    şimdi geçelim bilgilere

    standartlara uyan en eski rezalet başlığımız 13 yıl önce, 3 şubat 2003'te açılmış :
    1 şubat 2003 babylon'da polis rezaleti

    ondan sonra 7 sene kimse bu formatta başlık açmamış. 2010 yılında 2 tane açılmış. yıllara göre dağılım aşağıdaki gibi.

    toplam 1345 başlık var aslında. ama 52 başlıkta ilk entry'yi yazan suser @ekşisözlük ve başka entry yok. bunlar yazım hatasına sahip başlıkların doğru başlığa yönlendirmesini içeriyor sadece. hariç tuttum o yüzden.

    opening year sum of count
    2003 1
    2010 2
    2011 9
    2012 6
    2013 8
    2014 187
    2015 842
    2016 238
    grand total 1293

    başlığı açan üyelere göre sıraladığımızda ilk 5 aşağıdaki gibi.

    seviyorsevmiyorseviyorsevmiyorseviyor 22
    betada don bebegim yok diye uye oldum 22
    redvelve 9
    nerede o eski bayramlar 8
    insan donuna girmis telli turna 7

    en çok rezalet başlığı açma istatistiğinde zirveyi 22 başlık ile iki yazar paylaşıyor.

    rezil olarak tanımladığım, tarih ile rezalet ifadesinin arasındakileri saydırdım. 974 farklı rezil buldum. bunları sıraladığımda pegasus 27 rezalet ile ilk sırada.

    10 ve daha fazla başlığı olan reziller aşağıdaki gibi.

    row labels sum of count
    pegasus 27
    ekşi sözlük 24
    ttnet 23
    thy 22
    hepsiburada.com 19
    turkcell 11
    ekşi sözlük debe 11
    digiturk 11
    debe 10

    yalnız burada biraz data cleansing gerekiyor. burada da görüleceği gibi örneğin debe iki farklı şekilde yazılmış.

    hepsiburada'nın .com eklenmeden açılmış 6 tane daha rezaleti var. ikinci sırada olması gerekirken 5. sıraya düşmüş.

    entry sayısına göre bakarsak 1293 başlıkta toplam 17 bin 205 entry olduğunu görüyoruz.

    283 başlıkta sadece 1 entry var.
    en çok entry olan 5 başlık ise aşağıdaki gibi.

    row labels sum of entry count
    6 eylül 2014 little caesars rezaleti 640
    25 aralık 2015 regus ofis rezaleti 318
    23 aralık 2015 irfan home rezaleti 240
    23 ocak 2015 midpoint rezaleti 213
    23 ocak 2016 son feci bisiklet konseri rezaleti 188

    bu başlıklara 7683 farklı suser yazmış.
    en çok rezalet entry'si giren 5 suser aşağıdaki gibi.

    row labels count of entry ıd
    hugeegosorry 54
    seviyorsevmiyorseviyorsevmiyorseviyor 42
    nerede o eski bayramlar 39
    gastiro 37
    betada don bebegim yok diye uye oldum 37

    başlıklarda yazmış farklı suserlerin sayılarına göre başlıkları sıralarsak top5 aşağıdaki gibi çıkıyor.

    row labels sum of suser count
    6 eylül 2014 little caesars rezaleti 548
    25 aralık 2015 regus ofis rezaleti 252
    23 aralık 2015 irfan home rezaleti 206
    23 ocak 2015 midpoint rezaleti 194
    4 ocak 2016 domino's pizza rezaleti 179

    entry sayısına göre yaptığımız liste ile bu listenin ilk dördü aynı. 5. sıraya dominos pizza yerleşmiş.

    aklıma geldikçe zenginleştiririm artık. önerilere açığım.

    not : bu istatistikler 28 şubat 21:00 civarında alınan verilere göre hazırlanmıştır.