İlgili makaleye sunum olarak erişmek için:
A_cross-sectional_examination_of_marketing_of_electronic_cigarettes_on_Twitter

“A cross-sectional examination of marketing of electronic cigarettes on Twitter” başlıklı çalışma Jidong Huang, Rachel Kornfield, Glen Szczypka, Sherry L Emery tarafından yapılmış olup 2014 yılında Tobacco control,23.suppl 3: iii26-iii30’de yayınlanmıştır.

Çalışmanın yayınlandığı dergi olan (SCI) Tobacco Control(http://tobaccocontrol.bmj.com/)’ün Impact Factor değeri 6.321’dir.

Sosyal medya üzerinde elektronik sigara satışının yaygın olduğu bilinmekte fakat bunun ne şekilde yapıldığı tam olarak bilinmemektedir. Twitter Firehose’dan elde edilmiş elektronik sigara ile ilgili 1 Mayıs 2012 ve 30 Haziran 2012 tarihleri arasında gönderilmiş tweetler toplanmıştır. Ticari ve ticari olmayan şeklinde Naive Bayes, Anahtar kelime algoritmaları ve insan kodlaması ile sınıflandırma yapılmıştır. 73672 tweet toplanmış ve %90’ı ticari olarak etiketlenmiştir. Sosyal medya etkinliğinizi ölçerek 0-100 arasında bir puan ile değerlendiren Klout puanı ile incelendiğinde elektronik sigara reklamını yapan hesapların Klout puanlarının düşük olduğu belirlendi. Ticari tweetlerin %94’ü çok aktif olan küçük bir grup tarafından atılarak, ilgili firmaların web sayfalarına ait linkler içermektedir. Ticari ve organik tweetlerin %10’u sigarayı bırakma ile ilgiliyken, %34’ü sigara fiyatları veya indirimleri ile bilgi vermektedir.

2010 yılında %3 olan elektronik sigara kullanımının 2011 yılında 2 katına çıkarak %6 olduğu açıklanmıştır. Bir çok platformda elektronik sigara reklamları yapılmaktadır. Elektronik sigara kullanan kişilerin sigarayı tamamen bıraktıkları veya elektronik sigara ile devam ettikleri söylenmektedir. Sigara reklamının yasak olması ve elektronik sigara reklamının henüz yasak olmaması sosyal medyada bu ürünün pazarlanmasına yönelik ilgiyi açıklamak için söylenebilir.

Twitter 2006 yılında kurulmuş ve hızla büyüyen bir mikroblog sitesidir. 2013 itibariyle aylık 200 milyon aktif kullanıcı, 500 milyon tweet atmakta ve 2,1 milyar arama yapmaktadır. Kullanıcılarının %30’u genç(18-29 yaş) ve %27’si Afro-Amerikan, %28’i Latin, %14’ü beyazdır.

Oluşturulan veride;
Tweet’in içeriği
Zaman
Mekan(kullanıcı izin verdiyse)
Kullanıcının takip ettikleri
Kullanıcının takipçileri
Kullanıcının Klout puanı

Twitter Firehose, Twitter’ın sertifikalı tam veri akışı hizmetidir. Tweet içeriklerinde genel manada elektronik sigara fiyatları, güvenilirliliği ve sigarayı bırakma ile ilgili konular geçmektedir.

METOD
Veri Toplama

gnip

Twitter’ın lisanslı veri sağlama şirketlerinden olan Gnip ( https://www.gnip.com/ ) üzerinden belli bir ücret karşılığı veriler temin edilmiştir. Twitter API hizmeti gerçek zamanlı tweet akışının %1’ini vermektedir. Firehose ise %100 erişim imkanı sağlamaktadır.

Twitter API ile Firehose’un detaylı karşılaştırmasının yapıldığı “Is the Sample Good Enough? Comparing Data from Twitter’s Streaming API with Twitter’s Firehose” çalışması ilgililerce incelenebilir.

‘e-cigarette’
‘ecigarette’
‘e-cig’
‘ecig’

kelimeleri geçen,
‘electronic’ ‘blu’ ‘njoy’ kelimeleri ile birlikte ‘cig’ veya ‘cigarette’ geçen

tweetler toplanmıştır.

Blu ve Njoy, ABD’de en çok satılan e-sigara markalarıdır. (Nielsen markası da vardır ama dahil edilmemiştir.)

‘vape’ kelimesi geçen tweetler toplanmamıştır.

Kelimelerdende anlaşılacağı üzere sadece İngilizce tweetler toplanmıştır.

Toplanan tweetlerin içerisinden çekilen 500 tweet’lik bir veri analiz edilmiş. İçeriğin %99 İngilizce ve %99 e-sigara ile ilgili olduğu görülmüştür.

İçerik Kodlaması

Toplanan tweetleri organik veya ticari olarak sınıflandırmak için insan kodlaması ve makine öğrenimini birleştiren iteratif bir süreç kullanılmıştır. Bulut tabanlı bir metin analiz yazılımı olan DiscoverText, tweetleri toplamak, arşivlemek ve makine sınıflandırması için kullanılmıştır.DiscoverText, kodlamadan önce ön işlem gerektiren hiçbir metin gerektirmez.

discover-text

Sponsor olunmamış, bireysel düşünceleri veya deneyimleri yansıtan ve tanıtım amaçlı olmayan içerikler organik tweet olarak sınıflandırılmıştır.

Markalı tanıtım mesajları, Ticari web sitelerine bağlantı veren URL’ler, Ticari sitelerle olan ilişkileri gösteren kullanıcı adları, yalnızca kullanıcının promosyon tweetlerinden oluşan Twitter sayfaları (yani spam gönderen hesaplar) ticari tweet olarak sınıflandırılmıştır.

Ticari bağlantılar barındıran kişisel görünümlü tweetler de ticari olarak sayılmıştır. Ayrıca direk satış yapmasa da satıcılara yönlendiren veya reklam içeren sitelerde ticari olarak sayılmıştır.

Toplanmış tweetlerden rastgele seçilen 2000 tanesi 2 insan kodlayıcı tarafından ticari veya organik olarak sınıflandırılmışlardır. Bu iki insan kodlayıcı ek 500 tweet’te 0.93 oranında bir örtüşme ile aynı karara varmışlardır. Hazırlanmış olan bu eğitim seti ile Naive Bayes sınıflandırıcısı eğitilmiştir.

500 örnek tweet ile makine ve insan sınıflandırıcılar kıyaslandığında; Makine sınıflandırıcının ticari tweetleri daha başarılı bir şekilde tasnif ettiği görülmüştür. Bazı ticari tweetleri, organik olarak yanlış sınıflandırma işlemini, organik olanları ticari olarak sınıflandırmaya göre daha fazla yapmıştır.

Bu aşamadan sonra aşağıdaki değişiklikler yapılmıştır.

-Bir tweetin içeriği, birden çok tweet de de bulunuyorsa ticari olarak nitelendirilmiştir.
-Ayrıca “coupon, discount, free trial,starter kit” gibi ticari kelimeler içeren tweetler ticari olarak nitelenmiştir.
-Kullanıcı adından açıkça bir ticari işletme olduğu belli olan(örneğin VaporGod LLC) kişilerin attığı tweetler ticari sayılmıştır.

Bu geliştirmelerin ardından yaklaşık 1500 tweetin sınıfı değişmiştir.

Son yaklaşımı test için seçilen rastgele 500 tweet incelendiğinde 0.88 oranında insan kodlayıcıların bilgileriyle örtüştüğü görülmüştür.

Sigarayı bırakmaya yönelik olan ve olmayan tweetleri sınıflandırmak için de benzer bir birleştirilmiş yaklaşım kullanılmıştır.

“Stop smoking with the electronic cigarette starter kit…”
“Need to quit smoking #ecig,”
“Give up smoking with electronic cigarettes?”

Yukarıdaki 3 tweet sigarayı bırakma ile ilgilidir.

2 insan kodlayıcının 0.90 örtüşmeyle sınıflandırdığı 3500 tweet ile eğitilen sistemin, sigarayı bırakmama ile ilgili tweetleri sigarayı bırakma ile ilgili sanma oranı tersine göre daha fazla çıkmıştır.

Yeniden bir geliştirme için inceleme yapılmıştır.
-‘quit*’ ve ‘stop sm*’ ile başlayan tweet, kullanıcı adı ve URL’ler sigarayı bırakma ile ilişkilendirilmiştir.

Makine sınıflandırıcısı ve anahtar kelime algoritmalarının uyuşmadığı yaklaşık 5000 tweet direk/gözle/manuel incelenmiş ve yaklaşık 3500’ü yeniden sınıflandırılmıştır. Son kodlama süreci insan kodlayıcıları ile 0.87 oranında tutarlı çıkmıştır.

Ticari tweetlerin içerisinde:

‘health’ kelimesi bulunanlar: Sağlıkla ilgili
‘safe’ kelimesi bulunanlar: Güvenlikle ilgili
“money, deal, %, $, save, promo, dollars, discount, coupon, code, price, cost” kelimesi bulunanlar ise Fiyat ve İndirim ile ilgili olarak belirlenmiştir.

Hesap bilgilerinin analizi

Hesap bilgilerini analiz ederken;
-Kullanıcıyı takip eden kişi sayısı
-Klout puanı

Toplam kullanıcıların %8’ine tekabül eden 1889 kullanıcı için Klout puanı yoktur. Takipçi verileri Gnip’te 28 Mayıs 2012’den itibaren kullanıma sunulduğunda tweetleri takip eden toplam kullanıcı verisi Haziran 2012’den itibaren hesaplanmıştır.

SONUÇLAR:
1 Mayıs-30 Haziran 2012 arasında e-sigara ile ilişkili Twitter Firehose üzerinden temin edilmiş 73 672 tweet üzerinde çalışma yapılmıştır.
23 700 farklı Twitter kullanıcı bu tweetleri atmıştır.
1208 : günlük atılan ortalama tweet sayısı (Standart Sapma=325).
3 : Kullanıcı başı atılan yaklaşık tweet sayısı(Standart Sapma=90.7)

14319 hesabın takipçi sayıları erişilebilir durumdadır.
845 : Ortalama takipçi sayısı (Medyan değeri 53)
Takipçi sayısı (Standart Sapma=7230) çok çeşitlilik göstermektedir.
Hesapların % 13.4’ünün 10 kişiden az takipçisi varken,
Hesapların % 11.1’i 1000’den fazla takipçiye sahiptir.

Characteristics-of-organic-and-commercial-tweets

Tabloya ek olarak;

URL analizi yapıldığında
.com adresler(85.2%)
.org (4.8%)
.net (4.6%)

vaporgod.com (13 244 kere),
purecigs.com (4546 kere)
bestcelebrex.blogspot.com (3232 kere). {Bu sitede şu anda içerik yok. O dönem reklam amaçlı kullanılmış bir hesap olabilir.}

Tweet etkinliği, en aktif kullanıcılar arasında yoğunlaşmıştır; ilk üç kullanıcı, e-sigara tweet’lerinin % 25’ini ve ilk 100 kullanıcı ise e-sigara tweet’lerinin % 48’ini araştırma süresi boyunca üretmiştir.

Distribution-of-activity-across-Twitter-accounts-who-posted

Kullanıcı sayılarının attığı tweet’e göre dağılımı yukarıda verilmiştir. Görüleceği üzere 1 kullanıcı 10000’den fazla tweet atmış, en aktif 10 kullanıcı içerisinde URL içeren ticari tweetlerin %99.6’sını atmıştır.

23700 kullanıcının 589 tanesinin isimlerinde e-sigara ile bağlantılı olan ‘vape,’ ‘vapor,’ ‘cig,’ ‘smok’ veya ‘elec.’ kelimeleri bulunmaktadır. Bu 589 kullanıcı, çalışma süresi boyunca 30 046 tweet üretti veya toplam tweetlerin % 40.7’sini üretmiş oldu. Bu tweet’lerin 29 898’i (% 99.5) ticari olarak sınıflandırılmıştır.

Health-safety-cessation-price

Ticari tweetlerin sağlık, güvenlik, sigarayı bırakma ve fiyat şeklinde alt kategorilere sınıflandırılmış hali yukarıdaki tabloda görülmektedir.

SONUÇ VE TARTIŞMA

Analizler, reklam ve tanıtımın, e-sigara ilgili Twitter içeriğinin ezici çoğunluğunu temsil ettiğini ortaya koymuştur. 2 aylık zaman dilimi içerisinde incelenen yaklaşım 74000 tweetin %90’ını bir grup aktif Twitter kullanıcısı oluşturmuştur.

İncelenen tüm tweetlerin % 25’inin sadece üç kullanıcı tarafından üretilmesi otomatik bir tweet üretme mekanizması olduğunu göstermektedir; bu kullanıcılar, toplu tweet için şirketler tarafından ayarlanmış ‘bot’lar’ olabilir.

Çalışma Twitter üzerinde ciddi bir şekilde e-sigara pazarlaması yapıldığını ortaya koymaktadır.Gençlerin yoğun olarak kullandığı bir ortamda bu şekilde e-sigara reklamının yapılmasını onlara bu kötü alışkanlığı kazandırabileceği unutulmamalıdır. Fayda ve zararı tam olarak ortaya konmamış e-sigara’nın genel sağlık riski taşıyıp taşımadığı belirlenmelidir.

Çalışmanın eksikleri ve sorular

-2 aylık bir dönemi kapsayan alan kesitsel bir çalışma olduğundan daha uzun dönemli yapılabilir.
-Çalışmanın TV’de e-sigara reklamlarının yapıldığı dönemden önceki verilerle olduğu belirtilmiştir. Bu yüzden periyot uzatılarak analiz devam ettirilebilir.
-Sektördeki yeni markaların isimleri, ‘vape’ kelimesi ve e-sigarayı niteleyen başka kelimeler ile analiz geliştirilebilir.
-Kullanıcılar arası iletişim ile ilgili elimizde veri bulunamadığından kim kimi takip etmiş, retweet ve bahsetme ile ilgili analiz yapamadık. Bu analiz yapılabilir. Ayrıca, ticari bir içeriği retweet eden bir organik kullanıcının şirket tarafından teşvik edilip edilmediğini güvenilir bir şekilde tespit edemiyoruz.
-Analiz sonuçları, Twitter arama arayüzünü kullanarak e-sigara ile ilgili anahtar kelimeleri aktif olarak araştırarak görülen içeriği hesaba katmıyor.
-Ürünlerin çekicilik, güvenlik ve sigarayı bırakma konusundaki başarılarını daha iyi anlamak için e-sigara hakkındaki organik tweet içeriği incelenebilir.

Çalışma alanında yenilikçi olması açısından önemlidir. {Aradan geçen 2 yılda yaklaşık 100 atıf alması çalışmasının ilgi çekiciliğini ortaya koymuştur.}
Makine öğrenmesi kullanarak, sigara ile ilgili big data’yı analiz etmesiyle öncüdür.
Twitter verilerini kullanarak yapılan araştırmalar nispeten yenidir ve bu verilerin sınıflandırılması ve analiz edilmesi için standartlaştırılmış metodolojilere ihtiyaç duyulmaktadır.

İndirmek için tıklayınız:
A_cross-sectional_examination_of_marketing_of_electronic_cigarettes_on_Twitter

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir