Güzel Diyagramlar Oluşturmak: Veri Görüntüleme Hakkında Temel Bilgiler

30 Mart 2012  |  Eğitim  |   |  2 Yorum

Güzel Diyagramlar Oluşturmak: Veri Görüntüleme Hakkında Temel Bilgiler

Tezgahta çalıştınız ve hipotez testinizin sonuçlarını sunuma hazırlamadan önce titizlikle analiz etmek üzere olduğunuz verileri oluşturdunuz. Bu gönderide, verilerin güzel (ve tutarlı) görüntülenmesine katkıda bulunan unsurları tartışacağız. Analiz tutarlılığı ile ilgili daha geniş temalar hakkında bir tartışma için Akış Sitometresinde Analiz Tutarlılığı hakkındaki son gönderimizi inceleyin.

Kısaca neler olacağını özetlemek gerekirse: tüm verilerinizin ölçeğe uygun olduğundan, doğru şekilde telafi edildiğinden ve tüm diyagramlarınızın iyi şekilde etiketlendiğinden emin olun.

Diyagram türlerini, uygun istatistikleri seçme ve hikayenin tamamını anlatma

Uygun şekilde kullanıldığında hikayenizi farklı, görsel açıdan güzel şekillerde anlatmanıza yardımcı olabilecek bir dizi grafik türü vardır. Verileri daha gösterişli görüntülemek için ısı haritaları, histogramlar ve katmanlı histogramlar kullanılabilir. Bu tek boyutlu gösterimlerin çekiciliği, büyük ölçüde anlaşılması kolay bir mesaj iletme kapasitelerinden kaynaklanır. “Bu popülasyon Y durumunda X miktarında değişti.” Bu durum, heterojen bir popülasyonu tanımlamaya çalışıyorsanız zorlaşır. Hikayenizi iletmek için kullanılacak bir diyagram türüne karar verirken, veri görüntülemenin bir boyutunu ortadan kaldırma sürecinde alt kümelerin davranışı hakkında önemli bilgileri atlamadığınızdan emin olmak ve tüm ayrıntıları belirttiğinizden emin olmak isteyeceksiniz. Cytobank’ta, verilerinizin başka bir boyuttaki bilgilerini ortaya çıkaracak olan altta yatan nokta grafiğini görüntülemek için bir ısı haritası karesinin üzerine fare ile gidebilirsiniz.

Şekil 1. Bir ve iki boyutlu görüntüler kullanılarak iyi etiketlenmiş bir şekil örneği.
Irish JM et al (2010) PNAS, 107(29):12747-54, Şekil 1B’den alınmıştır.
(Daha yüksek çözünürlük için görüntüye tıklayın)


Diyagram içeriklerinizi değerlendirmek için uygun istatistiksel önlemleri seçmek, verilerin illüstrasyonlarını oluşturmanın bir sonraki adımıdır. Bir popülasyon için ham MFI'daki değişiklikleri incelemek istediğiniz bazı durumlar veya istatistiksel ölçümünüz olarak geçitteki yüzdeyi veya 95. yüzdeliği kullanmak isteyeceğiniz nadir popülasyonların ortaya çıktığı diğer durumlar olabilir. Bu istatistiksel ölçümler ile Cytobank üzerindeki diyagramlarınızın altındaki istatistikler tablosu doldurulur ve ısı haritaları ve katmanlı histogramlar için renk ölçekleri konusunda renk kodlamasını bilgilendirir.

Etiketleme

Diyagram türlerini ve istatistiksel ölçümleri seçtikten sonra, diyagramlarınızın tutarlı bir şekilde iyi etiketlendiğinden emin olmak isteyeceksiniz. Verilerinizin yorumlanması için yeterli etiketleme kritik öneme sahiptir. Eksenlerin etiketlendiğini ve tüm diyagramlar için onay işaretlerinin mevcut olduğunu kontrol edin. Isı haritaları ve diğer renklendirilmiş gösterimler için renk ölçeklerinin mevcut olduğundan emin olun. Cytobank Çizimleri, gerekli etiketleme bileşenlerini içeren diyagram düzenlerini otomatik olarak oluşturmak için tasarlanmıştır ve renk ölçeği değerleri ve onay işareti numaralarının gösterilmesi gibi unsurlar “Plots: Scale Display” (Diyagramlar: Ölçek Gösterimi) kutusu aracılığıyla Çalışma Çizimi sayfasının sol kısmından özelleştirilebilir.

Telafi

Çok renkli floresans tabanlı akış sitometresinin fazlasıyla olduğu bu çok düzeyleme döneminde, bir telafi matrisinin uygulanması bir veri kümesini büyük ölçüde dönüştürür. Verilerin fazla veya az telafi edilmediğini doğrulamak, güzel diyagramlar oluşturma sürecinde bir diğer adımdır. Tam kan örneğini, FITC-anti-CD3, PE-anti-CD4 ve PE-Cy5-anti-CD8 ile boyadığınız ve ayrıca tekli boya kontrolleri topladığınız bir örneği düşünün. Bu emisyon spektrumları arasında çakışma vardır ve bu nedenle telafi azaltma çakışma sinyaline uygulanmalıdır. Verilerin uygun şekilde telafi edildiğini ve fazla veya az telafi edilmediğini belirlemek isteyeceksiniz.

Şekil 2. Tek bir boya telafisi kontrol düzeni kullanarak telafinin değerlendirilmesi
(Daha yüksek çözünürlük için görüntüye tıklayın)

Fazla veya az telafiyi kontrol etmenin bir yolu, tek boyalı telafi kontrollerinizin diyagramlarını yerleştirerek her bir boya kontrolü için her bir kanaldaki verileri gösteren bir Çizim oluşturmaktır (Şekil 2). Bunu, deneyinizle birlikte çalıştırdığınız tekli boya telafisi kontrollerinizi kullanarak yapabilirsiniz. Uygun telafi uygulandığında, pozitif kanalda iki pik, diğer kanalların tümünde sadece bir pik olduğunu göreceksiniz. Yukarıdaki örneğimizde olduğu gibi, FITC kanalında FITC pozitif kontrolü için iki pik olacaktır ve veriler uygun şekilde telafi edildiğinde PE ve PE-Cy5 kanallarının her biri bir pik noktasına sahip olacaktır. Veriler yetersiz düzeyde telafi edilmişse, PE kanalında iki pik noktası görürsünüz. Benzer şekilde, veriler aşırı telafi edilmişse, PE kanalında iki pik noktası da görürsünüz. Tüm kanallarda görüntülenen tek boya kontrollerinizin yerleşimini ayarlamak, telafi matrisi değerlerinizi optimize etmenize yardımcı olacaktır. Telafinizin etkilerini incelemenin bir başka yolu da, Cytobank üzerinde Çalışma Çizimi’nin Gelişmiş Görünümleri bölümünde bulunabilecek örnek verileriniz için eşleştirilmiş grafikler görünümünde birbirine karşı çizilen tüm kanalları görüntülemektir.

Ölçek Ayarları

Akış sitometresi verilerini görüntülerken göz önünde bulundurulması gereken en önemli faktörlerden biri de ölçek ayarlarıyla ilgilidir. Uygun ölçek ayarlarının etkilerini göstermek için tekdüze tanecikler kullanarak bir örneğe yaklaşırken, Şekil 3 bir negatif kontrol kullanarak ölçek minimum değerinin ve kofaktör değerinin nasıl ayarlanacağını göstermektedir. Bu örnekte, varsayılan Cytobank ölçek ayarları yükleme sonrasında deneye otomatik olarak uygulanmıştır (Şekil 3A) ve ölçek ayarları ile kofaktör uygun veri görünümü için ayarlanmıştır (Şekil 3C). Bazı arka planların ve ölçek görüntüleme değerlerinin nasıl düzeltileceğinin üzerinden geçeceğiz.

Şekil 3. Ölçek minimum, maksimum ve kofaktör değerlerini ayarlamak için negatif kontrol tanecikler (ör. telafi tanecikleri) kullanma.

Kavramsal bir düzeyde, tüm verilerin grafiklerinizde görünür olmasını (yani kesme olmaması) ve tek hücre dağılımlarının popülasyonların varlığını veya yokluğunu doğru şekilde yansıtmasını istediğinizi bilirsiniz. Bu yöndeki iyi bir ilk adım, veri edinimi yazılımında (dijital makineler için) etkinleştirilmiş çift eksponansiyel ölçeklendirmeye sahip floresans verilerini topladığınızdan emin olmaktır, çünkü bu sıfırın altındaki değerlere sahip verileri toplamanıza olanak sağlayacaktır. Genel olarak, toplama yazılımı ölçek minimum değerini tüm olayların elde edileceği şekilde otomatik olarak ayarlar ve bu ayarları her zaman manuel olarak ayarlayabilirsiniz.

Analiz tarafına geçtiğimizde, birçok analiz platformu verilerinizin görselleştirilmesine uygulanan bir dizi standart ölçek ayarına sahiptir ve bu ölçek ayarlarının, tüm verilerinizin görünür olmasını ve dağıtımların doğru şekilde kalibre edilmesini sağlamak amacıyla sıklıkla ayarlanması gerekir. Bunu yapmanın harika bir yolu da, her kanal için negatif kontrollere yönelik kanal verilerini gösteren bir Çizim oluşturmaktır (ideal olarak önceden uygulamayı planladığınız telafi matrisi ile). Bu, yukarıdaki “Telafi” bölümünden (Şekil 2) elde edilen aynı tek boyalı kontrol düzenidir ve bunu örneklerinizle birlikte zaten çalıştırdığınız tek boyalı telafi tanecik kontrollerini kullanarak yapabilirsiniz. Deney analizine devam etmeden önce bu negatif kontrollere dayalı deney ölçeği ayarlarını oluşturabilirsiniz. Yukarıdaki şekil, telafi kontrollerinin ölçek ayarlarını yapmak için kullanıldığı bu şekilde bir senaryoyu göstermektedir.

Şekil 3'teki örneğimize dönersek, bu verilere uygulanan varsayılan ölçek ayarları -200 minimum değerini ve 150 kofaktör değerini içermektedir (Şekil 3A). En soldaki kutuda bir ani artış görebiliriz ve genellikle pik noktasının düz göründüğünü fark edebiliriz, bu birçok olayın hala ölçek dışı olduğunu gösterir. Bu nedenle ilk adım, tüm olayların ekranda olduğundan emin olmak için ölçeği minimuma indirmektir (Panel 3B, ölçek minimum = -1000). Ardından, sinyal pikinin bu kanalda sinyal olmadan tekdüze tanecikler kullanılmasına rağmen normal bir dağılıma uymadığını görüyoruz.

Kofaktörün devreye girdiği yer burasıdır. Kofaktör, sıfır etrafındaki doğrusal bölgenin boyutunu yönetir. Kofaktör ne kadar büyükse, doğrusal bölge o kadar küçüktür. Varsayılan olarak, kofaktör Cytobank'ta 150'ye ayarlanır. Bu örnekte, kofaktörün 450'ye yükseltilmesi doğrusal bölgeyi küçültür ve diğer kanallardaki piklerin şeklini yansıtan normal olarak dağıtılmış bir pikle (Panel 3C) sonuçlanır. Kofaktörü artırmak yerine düşürürsek, doğrusal bölge genişler ve sıfıra yakın bir “veri deliği” oluşur, bu da yalnızca bir popülasyonun mevcut olduğunu bildiğimiz iki popülasyonun yapay bir şekilde görüntülenmesine neden olur (Şekil 3D). Tekdüze bir negatif kontrol kullanmak suretiyle her kanal için ölçek ayarlarını ve kofaktörleri ayarlayarak, tüm verilerinizin görüntülendiğinden, uygun durumlarda popülasyonların ortaya çıkarıldığından (ve yanlış popülasyonların ortaya çıkarılmadığından) ve genel bir tekdüze görünüme ve hisse sahip olduklarından emin olabilirsiniz. Kofaktör, ölçek maksimum değeri ve ölçek minimum değeri her kanal için ayarlanmalıdır.

Az önce bahsettiğimiz aynı mantığı izleyerek ölçek ayarlarının veri görüntüleme üzerindeki etkilerinin başka bir örneği aşağıdaki gibidir. Bu örnekte, 1:1 boyanmış:boyanmamış telafi taneciklerinin karışımı:

Şekil 4. Ölçek minimum değerinin ve kofaktörün veri görüntüleme üzerindeki etkileri: 1:1 pozitif ve negatif telafi tanecikleri karışımının ölçek dönüşümlerinin karşılaştırılması (J. Irish tarafından sağlanmıştır)
(Daha yüksek çözünürlüklü görüntü için tıklayın)

Bazı sitometrelerin varsayılan olarak Log10 ölçeğini kullandığını (örneğin, FACSCalibur ve LSR II) ve sıfırın altındaki olayları toplamak için özellikle çift eksponansiyel ölçeklendirmeyi etkinleştirmeniz gerektiğini unutmayın. Aşağıda, çift eksponensiyel ölçeklendirme olmadan Log10 ölçeğinde sıfıra yakın veri görüntülemenin olumsuz yanı gösterilmektedir:

Şekil 5. Çift eksponansiyel ölçekleme olmadan bir logaritma ölçeğinin kullanılması veri kesilmesine neden olabilir.
(Daha yüksek çözünürlüklü görüntü için tıklayın)

Şekil 5A'da, Y ekseni yakınında ölçeğin alt ucunda verinin kesilmesine ve yapay bir üçüncü popülasyonun oluşturulmasına neden olan bir veri artışı olduğuna dikkat edin. Bu senaryoda, bu ölçek negatif olayları görüntüleyecek şekilde ayarlanmalıdır ve arksinh ölçeği kullanılarak, kofaktörün ayarlanması yoluyla doğrusal bölgenin sıfır etrafında yapılandırılması sağlanır.

Bu listeye eklenecek veri görüntüleme ipuçları veya herhangi bir soru / yorum var mı? Aşağıya bir not bırakın.

– Angela