ინფორმაცია

როგორ შევაფასოთ ბიოლოგიური გაზომვები მოყვება ნორმალურ ან ჟურნალ-ნორმალურ განაწილებას


მე ვიყენებ მონაცემთა ნაკრებს, რომელიც შედგენილია $ m $ ნიმუშებით და $ n $ მახასიათებლებით (გენებით). თითოეული მონაცემთა წერტილი არის რეალური რიცხვი.

მე მინდა გავიგო, როგორ ხდება მონაცემების წინასწარი დამუშავება ანალიზის დაწყებამდე, კერძოდ: მიჰყვება თუ არა მონაცემთა წერტილები ნორმალურ ან ჟურნალ-ნორმალურ განაწილებას?

მე ვიფიქრე qqplots– ის გამოყენებაზე და სხვადასხვა ტესტების ძიებაზე განაწილების ფორმის შესაფასებლად, მაგრამ ეჭვი მეპარება:

უნდა შევაფასო ფორმა:

  • თითოეული ნიმუშის განაწილება
  • თითოეული მახასიათებლის (გენის) განაწილება
  • მთელი მონაცემთა ნაკრები ($ m $ ნიმუშები x $ n $ მახასიათებლები (გენები))

?


პირადი გამოცდილებიდან გამომდინარე, თითქმის ყველა მონაცემის დათვლა მიკრო მასივიდან თუ რაიმე სახის RNAseq– დან ითვლის, ითვლის რიცხვის ჟურნალისტურ ტრანსფორმაციას. როგორც წესი, მცირე ნაწილი ემატება ყველა მნიშვნელობას, სანამ ამას გავაკეთებთ ნულოვან დაცვაზე. Log2 (ითვლის + 0.5) ან ზოგიერთი სხვა. ეს დამოუკიდებელია მკურნალობისგან. თუ თქვენ შეხვალთ ერთი ნიმუშის გარდაქმნაში, იგივეს გააკეთებთ ყველა ნიმუშზე. ნორმალურობის შესამოწმებლად, მარტივი გზაა თვლის ჰისტოგრამის დათვალიერება (ყველა ნიმუშის მიხედვით ან თითოეული ნიმუშის მიხედვით) ტრანსფორმაციამდე და მის შემდეგ. უხეშად ზარის ფორმის -> გააგრძელე.

სურათები ქვემოთ ჩემი მონაცემებიდან. მიუხედავად იმისა, რომ მონაცემები RNAseq– დან არის, მიკრო მასივის მონაცემები მსგავსი უნდა იყოს.

R კოდი აქ:

hist (t $ ითვლის, წყვეტს = 100, main = "ნედლი რიცხვების ჰისტოგრამა RNAseq") hist (log (t $ ითვლის + 0.5,2), წყვეტს = 100, main = "Log2- ის ჰისტოგრამა გარდაიქმნება რნმ -ისგან")


  • წინასწარი დამუშავება ყოველთვის და ყოველთვის უნდა იყოს დამოკიდებული იმ ბიოლოგიაზე, რომელსაც თქვენ ცდილობთ გასცეთ პასუხი ან აღმოაჩინოთ (მაგალითად: შეიძლება არსებობდეს ექსპერიმენტული დასაბუთება იმის დასაჯერებლად, რომ ზოგიერთი გენი განსხვავებულად იქცევა ცალკეულ ნიმუშებში - და რომ სხვადასხვა ნიმუშს შესაძლოა განსხვავებული განაწილება ჰქონდეს.)
  • ჟურნალ-მონაცემების თავისთავად გარდაქმნა, როგორც წესი, არ წარმოადგენს პრობლემას და უკიდურესად აადვილებს სხვადასხვა სიდიდის ერთდროულ ძიებას (თუმცა მცირე მნიშვნელობის წინასწარი ჩანაწერის დამატება მალე შეცდომაში შეგიყვანთ თქვენს ანალიზს, თუ თქვენ აპირებთ ნიმუშებში განსხვავების რაოდენობრივად შესწავლას)
  • ნორმალურობის შესამოწმებლად შეიძლება დაგჭირდეთ Lilliefors ტესტის გამოყენება ნედლეულ მონაცემებზე და ჟურნალ-ტრანსფორმირებულ მონაცემებზე
  • თუ თქვენ იყენებთ გენის გამოხატვის წაკითხვას, თქვენ არ უნდა ელოდოთ ერთგვაროვან განაწილებას, მაგ.: მეტაზოელებს აქვთ ორი განსხვავებული კლასის გენები, რაც საერთო ჯამში იწვევს ბიომოდალურ განაწილებას (Hebenstreit et al. 2011). უნიმოდური განაწილება - როგორიცაა ლოგნორმალური - თქვენ უნდა გახდეთ ძალიან საეჭვო და შეამოწმოთ ექსპერიმენტული მონაცემების ხარისხი.)

ბიოლოგიური მონაცემების ეტაპობრივი ანალიზი

აქ მე აღვწერ, თუ როგორ უნდა განსაზღვროთ თქვენი ბიოლოგიური ექსპერიმენტის ანალიზის საუკეთესო საშუალება.

როგორ განვსაზღვროთ შესაბამისი სტატისტიკური ტესტი

მე მიმაჩნია, რომ სისტემატური, ეტაპობრივი მიდგომა საუკეთესო საშუალებაა ბიოლოგიური მონაცემების გასაანალიზებლად. გირჩევთ, მიყევით ამ ნაბიჯებს:

  1. მიუთითეთ ბიოლოგიური შეკითხვა, რომელსაც თქვენ სვამთ.
  2. დასვით კითხვა ბიოლოგიური ნულოვანი ჰიპოთეზისა და ალტერნატიული ჰიპოთეზის სახით.
  3. დასვით შეკითხვა სტატისტიკური ნულოვანი ჰიპოთეზისა და ალტერნატიული ჰიპოთეზის სახით.
  4. განსაზღვრეთ რომელი ცვლადები შეესაბამება კითხვას.
  5. განსაზღვრეთ რა სახის ცვლადია თითოეული მათგანი.
  6. შექმენით ექსპერიმენტი, რომელიც აკონტროლებს ან რანდომიზებს დამაბნეველ ცვლადებს.
  7. ცვლადების რაოდენობის, ცვლადების ტიპების, პარამეტრული ვარაუდების მოსალოდნელი მორგებისა და შესამოწმებელი ჰიპოთეზის მიხედვით შეარჩიეთ საუკეთესო სტატისტიკური ტესტი გამოსაყენებლად.
  8. თუ შესაძლებელია, გააკეთეთ სიმძლავრის ანალიზი, რათა დადგინდეს ექსპერიმენტისთვის კარგი ნიმუშის ზომა.
  9. ჩაატარეთ ექსპერიმენტი.
  10. შეისწავლეთ მონაცემები, შეესაბამება თუ არა ის თქვენს მიერ არჩეული სტატისტიკური ტესტის ვარაუდებს (უპირველეს ყოვლისა ნორმალურობა და ერთგვაროვნება გაზომვის ცვლადების ტესტებისთვის). თუ ეს ასე არ არის, შეარჩიეთ უფრო შესაფერისი ტესტი.
  11. გამოიყენეთ თქვენს მიერ არჩეული სტატისტიკური ტესტი და შედეგების ინტერპრეტაცია.
  12. ეფექტურად გამოაქვეყნეთ თქვენი შედეგები, ჩვეულებრივ გრაფიკით ან ცხრილით.

ამ სახელმძღვანელოს მუშაობისას თქვენ გაეცნობით ამ პროცესის სხვადასხვა ნაწილს. თქვენ უნდა გახსოვდეთ ერთი მნიშვნელოვანი წერტილი: "ჩაატარეთ ექსპერიმენტი" არის ნაბიჯი 9 და არა ნაბიჯი 1. თქვენ უნდა იფიქროთ, დაგეგმოთ და მიიღოთ გადაწყვეტილებები ადრე თქვენ აკეთებთ ექსპერიმენტს თუ ამას გააკეთებთ, გექნებათ ექსპერიმენტი, რომლის გაგებაც ადვილია, გაანალიზებაც და ინტერპრეტაციაც, პასუხობს კითხვებს, რომელთა პასუხის გაცემას ცდილობთ და არც ძალიან დიდია და არც ძალიან პატარა. თუ თქვენ უბრალოდ ჩაატარებთ ექსპერიმენტს ისე, რომ არ ფიქრობთ იმაზე, თუ როგორ აპირებთ სტატისტიკის გაკეთებას, შეიძლება დაგჭირდეთ უფრო რთული და ბუნდოვანი სტატისტიკური ტესტები, მიიღოთ შედეგები, რომელთა ახსნა და ახსნა რთულია სხვებისთვის და შესაძლოა ძალიან ბევრი საგნის გამოყენება. (ამით ხარჯავთ თქვენს რესურსებს) ან ძალიან ცოტა სუბიექტს (ამით დაკარგავთ მთელ ექსპერიმენტს).

დროზოფილა მელანოგასტერი.

აქ არის მაგალითი იმისა, თუ როგორ მუშაობს პროცედურა. ვერელი და იანესი (2001) გაზომეს გლიკოგენის შემცველობა დროზოფილა მელანოგასტერი პირებს. ბუზები იყო პოლიმორფული გენეტიკურ ადგილას, რომელიც ასახავს ფერმენტ ფოსფოგლოკოუტაზას (PGM). PGM ცილის თანმიმდევრობით 52 ადგილზე, ბუზებს ჰქონდათ ვალინი ან ალანინი. 484 ადგილზე მათ ჰქონდათ ვალინი ან ლეიცინი. ამინომჟავების ოთხივე კომბინაცია (V-V, V-L, A-V, A-L) იყო.

  1. ერთ -ერთი ბიოლოგიური კითხვაა "გააკეთე ამინომჟავების პოლიმორფიზმი იქ გვ ლოკუსს აქვს გავლენა გლიკოგენის შემცველობაზე? "ბიოლოგიური კითხვა ჩვეულებრივ ეხება ბიოლოგიურ პროცესებს, ხშირად ფორმით" იწვევს თუ არა X- ის შეცვლას Y- ში ცვლილება? "შეიძლება დაგჭირდეთ იმის ცოდნა, ცვლის თუ არა წამალი არტერიულ წნევას, გავლენას ახდენს თუ არა ნიადაგის pH მოცვის ბუჩქების ზრდა თუ არა ცილა Rab10 შუამავალი მემბრანის გადატანა ცილიაში.
  2. ბიოლოგიური ნულოვანი ჰიპოთეზა არის "სხვადასხვა ამინომჟავების თანმიმდევრობა არ ახდენს გავლენას PGM- ის ბიოქიმიურ თვისებებზე, ამიტომ გლიკოგენის შემცველობაზე გავლენას არ ახდენს PGM თანმიმდევრობა". ბიოლოგიური ალტერნატიული ჰიპოთეზა არის "სხვადასხვა ამინომჟავების თანმიმდევრობა გავლენას ახდენს PGM- ის ბიოქიმიურ თვისებებზე, ამიტომ გლიკოგენის შემცველობაზე გავლენას ახდენს PGM თანმიმდევრობა". ბიოლოგიურ ნულოვან და ალტერნატიულ ჰიპოთეზებზე ფიქრით თქვენ დარწმუნდებით, რომ თქვენი ექსპერიმენტი განსხვავებულ შედეგს მისცემს თქვენს ბიოლოგიურ კითხვაზე განსხვავებულ პასუხებს.
  3. სტატისტიკური ნულოვანი ჰიპოთეზაა "PGM ფერმენტის სხვადასხვა თანმიმდევრობით ბუზებს აქვთ საშუალო საშუალო გლიკოგენის შემცველობა". ალტერნატიული ჰიპოთეზაა "ბუზებს PGM- ის განსხვავებული თანმიმდევრობით აქვთ განსხვავებული საშუალო გლიკოგენის შემცველობა". მიუხედავად იმისა, რომ ბიოლოგიური ნულოვანი და ალტერნატიული ჰიპოთეზა ეხება ბიოლოგიურ პროცესებს, სტატისტიკური ნულოვანი და ალტერნატიული ჰიპოთეზები ამ შემთხვევაში რიცხვებს ეხება, გლიკოგენის შემცველობა ან ერთია ან განსხვავებული. თქვენი სტატისტიკური ნულოვანი ჰიპოთეზის შემოწმება არის ამ სახელმძღვანელოს მთავარი საგანი და მან უნდა მოგცეთ მკაფიო პასუხი, თქვენ ან უარყოფთ ან მიიღებთ ამ სტატისტიკურ ნულს. არის თუ არა სტატისტიკური ნულოვანი ჰიპოთეზის უარყოფა საკმარისი მტკიცებულება თქვენს ბიოლოგიურ კითხვაზე პასუხის გასაცემად, ეს შეიძლება იყოს უფრო რთული, უფრო სუბიექტური გადაწყვეტილება, შეიძლება იყოს სხვა შესაძლო ახსნა თქვენი შედეგებისთვის და თქვენ, როგორც ბიოლოგიის სპეციალიზებული სფეროს ექსპერტმა, უნდა გაითვალისწინოთ რამდენად სარწმუნოა ისინი არიან.
  4. ვერელისა და იანის ექსპერიმენტის ორი შესაბამისი ცვლადი არის გლიკოგენის შემცველობა და PGM თანმიმდევრობა.
  5. გლიკოგენის შემცველობა არის გაზომვის ცვლადი, რასაც თქვენ ჩაწერთ როგორც რიცხვს, რომელსაც შეიძლება ჰქონდეს მრავალი შესაძლო მნიშვნელობა. PGM– ის თანმიმდევრობა, რომელიც ბუზს აქვს (V-V, V-L, A-V ან A-L) არის ნომინალური ცვლადი, რაღაც მცირე რაოდენობის შესაძლო მნიშვნელობებით (ოთხი, ამ შემთხვევაში), რომელსაც ჩვეულებრივ ჩაწერთ სიტყვის სახით.
  6. სხვა ცვლადები, რომლებიც შეიძლება იყოს მნიშვნელოვანი, როგორიცაა ასაკი და სადაც ფლაკონში ბუზი გაფუჭდა, ან კონტროლდებოდა (გამოიყენებოდა ყველა იმავე ასაკის ბუზი) ან რანდომიზირებული იყო (ბუზები შემთხვევით იღებდნენ ფლაკონებიდან, იმისდა მიუხედავად, თუ სად იყვნენ პუპები). ასევე შესაძლებელი იქნებოდა დამაბნეველი ცვლადების დაკვირვება, მაგალითად, ვერელს და იანესს შეეძლოთ სხვადასხვა ასაკის ბუზების გამოყენება, შემდეგ კი სტატისტიკური ტექნიკის გამოყენება ასაკის მიხედვით. ეს გაართულებდა ანალიზს უფრო რთულად შესასრულებლად და უფრო რთულად ასახსნელს, და შეიძლება აღმოჩნდეს რაიმე საინტერესო ასაკისა და გლიკოგენის შემცველობის შესახებ, მაგრამ ეს არ შეუწყობს ხელს მთავარ ბიოლოგიურ კითხვას PGM გენოტიპისა და გლიკოგენის შემცველობის შესახებ.
  7. იმის გამო, რომ მიზანი არის ერთი ნომინალური ცვლადის მიხედვით კლასიფიცირებული ერთი საზომი ცვლადის საშუალებების შედარება და ორზე მეტი კატეგორიაა, შესაბამისი სტატისტიკური ტესტი არის ცალმხრივი ანოვა. მას შემდეგ რაც გაიგებთ რა ცვლადებს აანალიზებთ და რა ტიპისაა ისინი, შესაძლო სტატისტიკური ტესტების რაოდენობა ჩვეულებრივ შემოიფარგლება ერთით ან ორით (ყოველ შემთხვევაში, ამ სახელმძღვანელოს ტესტებისათვის).
  8. სიმძლავრის ანალიზი მოითხოვს გლიკოგენის შემცველობის სტანდარტული გადახრის შეფასებას, რაც შესაძლოა გამოქვეყნებულ ლიტერატურაში მოიძებნოს და რიცხვი ეფექტის ზომაზე (გლიკოგენის შემცველობის ცვალებადობა გენოტიპებს შორის, რომელთა გამოცნობა ექსპერიმენტატორებს სურდათ). ამ ექსპერიმენტში, გლიკოგენის შემცველობის ნებისმიერი სხვაობა გენოტიპებს შორის საინტერესო იქნებოდა, ამიტომ ექსპერიმენტატორებმა გამოიყენეს იმდენი ბუზი, რამდენიც პრაქტიკული იყო ხელმისაწვდომი დროისათვის.
  9. ექსპერიმენტი ჩატარდა: გლიკოგენის შემცველობა გაზომეს ბუზებში სხვადასხვა PGM თანმიმდევრობით.
  10. ანოვა მიიჩნევს, რომ გაზომვის ცვლადი, გლიკოგენის შემცველობა, ნორმალურია (განაწილება შეესაბამება ზარის ფორმის ნორმალურ მრუდს) და ჰომოსკედასტურია (გლიკოგენის შემცველობა სხვადასხვა PGM თანმიმდევრობების თანაბარია), ხოლო მონაცემების ჰისტოგრამების შემოწმება აჩვენებს, რომ მონაცემები შეესაბამება ამ ვარაუდებს. თუ მონაცემები არ დააკმაყოფილებდა ანოვას ვარაუდებს, შესაძლოა უკეთესი ყოფილიყო Kruskal & ndashWallis ტესტი ან Welch– ის ტესტი.
  11. ცალმხრივი ანოვა გაკეთდა ცხრილის, ვებ გვერდის ან კომპიუტერული პროგრამის გამოყენებით და ანოვას შედეგი არის მნიშვნელობა 0.05 -ზე ნაკლები. ინტერპრეტაცია იმაში მდგომარეობს, რომ ზოგიერთი PGM თანმიმდევრობით ბუზებს აქვთ განსხვავებული საშუალო გლიკოგენური შემცველობა, ვიდრე ბუზებს PGM– ის სხვა თანმიმდევრობით.
  12. შედეგები შეიძლება შეჯამდეს ცხრილში, მაგრამ მათთან კომუნიკაციის უფრო ეფექტური გზაა გრაფიკით:

ცნობები

Სურათი დროზოფილა მელანოგასტერი ფარკლბერიდან.

ვერელი, ძვ.წ. და ვ.ფ. ეინესი. 2001. PGM ამინომჟავის პოლიმორფიზმის ფუნქციური გავლენა გლიკოგენის შემცველობაზე დროზოფილა მელანოგასტერი. გენეტიკა 159: 201-210. (გაითვალისწინეთ, რომ ამ ვებგვერდის მიზნებისათვის მე გამოვიყენე განსხვავებული სტატისტიკური ტესტი, ვიდრე ვერელიმ და ეინესმა. ისინი დაინტერესებულნი იყვნენ ინდივიდუალური ამინომჟავების პოლიმორფიზმებს შორის ურთიერთქმედებით, ამიტომ გამოიყენეს ორმხრივი ანოვა.)

& lArr წინა თემა | შემდეგი თემა & rArr Სარჩევი

ეს გვერდი ბოლოს შესწორებულია 2014 წლის 4 დეკემბერს. მისი მისამართია http://www.biostathandbook.com/analysissteps.html. ის შეიძლება მოიხსენიებოდეს, როგორც მაკდონალდსი, ჯ. 2014. ბიოლოგიური სტატისტიკის სახელმძღვანელო (მე -3 გამოცემა). Sparky House გამომცემლობა, ბალტიმორი, მერილენდი. ეს ვებ გვერდი შეიცავს 3-5 გვერდის შინაარსს დაბეჭდილ ვერსიაში.

& ასლი 2014 ჯონ ჰ. მაკდონალდსი. თქვენ ალბათ შეგიძლიათ გააკეთოთ ის, რაც გსურთ ამ შინაარსით, იხილეთ ნებართვების გვერდი დეტალებისთვის.


ზოგიერთი მნიშვნელოვანი სტატისტიკური განაწილება

2.2.3 ლოგნორმული განაწილება

ლოგნორმალური განაწილება არის შემთხვევითი ცვლადის უწყვეტი ალბათობის განაწილება, რომელშიც ლოგარითმი ჩვეულებრივ ნაწილდება. ამრიგად, თუ შემთხვევით ცვლადს X აქვს ლოგნორმალური განაწილება, მაშინ Y = ln (X) აქვს ნორმალური განაწილება. ანალოგიურად, თუ Y– ს აქვს ნორმალური განაწილება, მაშინ X = exp (Y) აქვს ლოგნორმალური განაწილება. შემთხვევითი ცვლადი, რომელიც ლონგორმალურად არის განაწილებული, იღებს მხოლოდ დადებით რეალურ მნიშვნელობებს.

მონაცემები შეიძლება იყოს განაწილების პარამეტრები ε, ξ, γ და შემდეგ PDF მოცემულია:

სავარაუდო ლიტერატურაში მოცემული ურთიერთობების გამოყენებით კომპლექტი ε = 0.47238 ξ = 0 .581575γ = 0 ითარგმნება μ = 2σ = 1γ = 0, ხოლო ნახ. 2.5 -ში ნაჩვენები PDF არის მიღებული.

სურათი 2.5. ლოგნორმული განაწილება μ = 2 σ = 1 γ = 0.


ბიოლოგიური მრავალფეროვნება (თეორიები, ზომები და მონაცემთა შერჩევის ტექნიკა)

კურსი წარმოადგენს ბიოლოგიური მრავალფეროვნების ევოლუციისა და დინამიკის თეორიის მიმოხილვას და მრავალფეროვნების გამოთვლისა და შეფასების მეთოდებს. ჩვენ გავეცნობით ძირითადი ალფა, ბეტა და გამა მრავალფეროვნების შეფასების ტექნიკას. იმის გაგება, თუ როგორ განვითარდა და ვითარდება დედამიწაზე ბიომრავალფეროვნება და როგორ სწორად გამოიყენოს და განმარტოს ბიომრავალფეროვნების მონაცემები მნიშვნელოვანია ყველა სტუდენტისთვის, რომელიც დაინტერესებულია კონსერვაციის ბიოლოგიითა და ეკოლოგიით, იქნება ეს კარიერა აკადემიურ სფეროში, თუ პოლიტიკის შემქმნელები და სხვა პროფესიონალები (სტუდენტები, რომლებიც ამთავრებენ ჩვენს პროგრამებს) ორივე). აკადემიკოსებს უნდა შეეძლოთ თეორიებისა და ინდექსების სწორად გამოყენება, ხოლო პოლიტიკის შემქმნელებს უნდა შეეძლოთ გაიგონ და განმარტოს აკადემიკოსების მიერ შემოთავაზებული დასკვნები. კურსს აქვს შემდეგი მოლოდინი და შედეგები: - მოიცავს ბიომრავალფეროვნების თეორიაში ჩართულ თეორიულ და პრაქტიკულ საკითხებს, - ბიომრავალფეროვნების კვლევებისა და ინვენტარიზაციის ჩატარებას, - შეგროვებული ინფორმაციის გაანალიზებას, და მათი ანალიზის გამოყენებას ეკოლოგიურ და კონსერვაციის პრობლემებზე. საჭირო შემსწავლელი ფონი: - ეკოლოგიისა და გაანგარიშების საფუძვლები - ინგლისურის კარგი გაგება

რეცენზიები

ეს არის დიდი კურსი, ბიოლოგიური მრავალფეროვნების ძალიან საფუძვლიანი და ყოვლისმომცველი შესავალი.

მე მივიღე ბევრი ცოდნა ბიოლოგიური მრავალფეროვნების შესახებ. მადლობა თსუ

ამ მოდულში ჩვენ ვისაუბრებთ სახეობების სიჭარბის გავრცელების ყველაზე გავრცელებულ მოდელებზე და მე გაჩვენებთ, თუ როგორ უნდა შეადაროთ სხვადასხვა საზოგადოება და ნიმუშები, რათა მიღწეულ იქნას რაოდენობრივი და სტატისტიკური ღონისძიება ბიოლოგიური მრავალფეროვნების ცვლილებების მკურნალობის შედეგად.

მე ავხსნი თანაბრობის რამდენიმე ზომას და როგორ წარმოვადგენ მათ ბიომრავალფეროვნების მრუდების სახით. ეს ხელს შეუწყობს თემების მრავალფეროვნების დისკრიმინაციას და ბიომრავალფეროვნებაზე ანთროპოგენური ზემოქმედების უკეთ გაანალიზებას.

პრეპოდავატელები

რობერტო კაზოლა გატი

Текст видео

[მუსიკა] გამარჯობა ბიჭებო. კეთილი იყოს თქვენი მობრძანება კურსის მე –20 ლექციაზე ბიოლოგიური მრავალფეროვნების თეორიები, ზომები და შერჩევის სხვა ტექნიკა. დღეს ჩვენ ვნახავთ როგორ გავაანალიზოთ ტროპოგენური ზემოქმედება ბიომრავალფეროვნებაზე. რა არის ტროპოგენური ზემოქმედება ბიომრავალფეროვნებაზე. მაგალითად, ჩვენ გვაქვს ტყეების გაჩეხვა, რაც ძალიან დიდი პრობლემაა. ჩვენ გვაქვს თევზაობა, დაბინძურება, წყლის დაბინძურება, ნაგვის დაბინძურება. ასე რომ, ბიოლოგიური მრავალფეროვნების ზემოქმედების განსხვავებული გზა. ამ გავლენის გასაანალიზებლად, ჩვენ გვაქვს სხვადასხვა მეთოდი. არსებობს მეთოდები, რომლებიც ემყარება უნივაციალურ ზომებს. მაგალითად, ინდექსები, რომლებიც ემყარება სახეობების სიმდიდრეს. ამრიგად, დარღვევის ეფექტი უფრო აშკარაა სიმრავლეზე. არსებობს ინდექსები სახეობების თანაბარ საფუძველზე, რომლებიც უკეთესად რეაგირებენ დარღვევაზე. და ჩვენ შეგვიძლია გამოვიყენოთ სხვადასხვა გზა ამის გასაზომად. მაგალითად, ჩვენ შეგვიძლია გამოვიყენოთ სიმფსონის ინდექსი, კარამაგოს ინდექსი, სმიტ-ვილსონის ინდექსი და Q თანაბრობა. რაც უფრო მაღალია თანაბარობა, მით უფრო ჯანმრთელია ტერიტორია. ასევე გამოიყენება ინდექსები, რომლებიც დაფუძნებულია სახეობათა მრავალფეროვნებაზე, მაგრამ ძნელია მათი შეფასება, თუ გსურთ შეადაროთ ეს ზემოქმედება ჩვენ გვჭირდება კარგი ინფორმაციის ან რეალური კარგი ინფორმაციის მიწოდებისათვის. ჩვენ ვიყენებთ განსხვავებულ მრავალფეროვნებას, რომელიც მოიცავს როგორც ინფორმაციას სიმდიდრისგან, ასევე თანაბარი ინფორმაციისგან. ეს შეიძლება დამაბნეველი იყოს. ასევე ინდექსები, რომლებიც დაფუძნებულია ტაქსონომიურ ან ფუნქციურ მრავალფეროვნებაზე. მომდევნო ლექციას რომ ვნახავთ, ისინი ძალიან გამოსადეგია ბიომრავალფეროვნების ზემოქმედების ამ ცალმხრივი ღონისძიების გასაგებად. ჩვენ ასევე ვაღიარეთ, რომ ჩვენი საფუძველია სახეობების სიმრავლის განაწილება. ეს მეთოდები ცდილობს შეაფასოს ბიომრავალფეროვნების ზემოქმედება, რომელიც გადადის ლოგ-ნორმალურიდან, ანუ ხელუხლებელი ზომის ერთგვარი პროქსიდან გეომეტრიულ სერიებზე, რაც იმას ნიშნავს, რომ ზომა ძალიან დარღვეულია. თუ გახსოვთ ბოლო ლექციებიდან, ჩვენ გვაქვს სხვადასხვა გზა სახეობების შიგნით გადანაწილებული ყველა პათოლოგიის საჩვენებლად. ასე რომ, log-normal არის საუკეთესო გზა, რადგან ეს ნიშნავს, რომ საზოგადოება ჯანმრთელია. და ეს იმას ნიშნავს, რომ შიგნით არის ხელუხლებელი. გეომეტრიული სერია არის ის, რის გამოც ჩვენ გვაქვს დიდი საცხოვრებელი სახეობები, რომლებიც აშლილობის სინონიმია. საუკეთესო მიდგომაა ჩვენი მონაცემების გეომეტრიულ სერიაზე მორგება და შემდეგ გამოთვლა ფერდობზე m ან რანგის სიმრავლის განაწილების განაწილების ფერდობზე. ამ გზით ჩვენ ვაანალიზებთ, არის თუ არა ადგილი ძალიან შეშფოთებული ან არც თუ ისე შეწუხებული ან სრულიად დაუბრკოლებელი ფერდობის და RAD– ის რეგრესიის შედარებისას. დაბალი ფერდობი ნიშნავს იმას, რომ უფრო მეტი თანაბარია და ისე, რომ ის მხარე, რომელსაც ჩვენ ვაანალიზებთ, შეუფერხებელია. მაღალი ფერდობ ნიშნავს იმას, რომ თანაბრობა ძალიან დაბალია და ამ შემთხვევაში მხარე ირღვევა, რადგან არსებობს სახეობების დომინირება. სიმდიდრის გავლენის თავიდან ასაცილებლად, ჩვენ შეგვიძლია გამოვიყენოთ, სმიტ-ვილსონის თანაბარი. ეს ძალიან სასარგებლოა ამ შემთხვევებში, როდესაც ჩვენ გვინდა გავაანალიზოთ ბიომრავალფეროვნების გავლენა. სხვა გზა, სახეობების განაწილების კიდევ ერთი მეტრი ბიომრავალფეროვნების ზემოქმედების გასაანალიზებლად არის ECDF, ემპირიული კუმულაციური განაწილების ფუნქცია, ან K- დომინირების მრუდები. და ბოლო გზა არის ახალი სისტემა, ახალი გრაფიკი, რომელიც მე მინდა გაჩვენოთ, რომ გავაანალიზოთ გავლენა, რომელიც არის ABC მოსახვევებში. ABC მრუდები არის მრუდები, რომლებიც ემყარება სიჭარბის და ბიომასის განაწილებას. ჩვენ ვიყენებთ ABC მრუდს ბიომრავალფეროვნების ზემოქმედების ზემოქმედების გასაანალიზებლად, რადგან ბიომასა განსხვავებულად იზრდება ბიომრავალფეროვნებასთან მიმართებაში, როდესაც ადგილი დარღვეულია თუ არა. ასე რომ, გახსოვთ ბოლო ლექციებიდან, რომ ჩვენ დავიწყეთ იმის ანალიზი, თუ რა არის ECD მრუდი. ასე რომ ემპირიული კუმულაციური განაწილების ფუნქციის მრუდი. ემპირიული კუმულაციური განაწილების ფუნქცია არის მძლავრი გრაფიკი იმის გასაგებად, თუ რა გავლენას ახდენს ტოპოგენური ზემოქმედება ბიომრავალფეროვნებაზე. მაგალითად, ამ მაგალითში ნახავთ სამ მოსახვევს. და ყველაზე მაღალი არის დაუბრკოლებელი ტყე, შუალედური არის დარღვეული ტყე, ხოლო ყველაზე დაბალი არის სასოფლო -სამეურნეო სფერო. მაგალითად, თქვენ ხედავთ სასოფლო -სამეურნეო ველს, როგორც კუბის შუალედურ ნაწილს, რომელიც საკმაოდ პარალელურად ან უფრო პარალელურად ეპსილონის ღერძთან არის შეუფერხებელ ტყესთან შედარებით. უფრო მეტიც, დაუბრკოლებელი ტყე არის მარცხენა დაბალი ნაწილი, რომელიც უფრო მაღალია ვიდრე სხვა ორი ჯგუფი. ეს ნიშნავს, რომ დაურღვეველ ტყეში იშვიათი სახეობების რაოდენობა უფრო მაღალია, ვიდრე დანარჩენი ორი. ბიომრავალფეროვნებაზე ზემოქმედების გაანალიზების კიდევ ერთი გზა არის K- დომინირების მრუდები. ამ მაგალითში ხედავთ, რომ ორი მრუდი არსებობს და ყველაზე მაღალი ნიშნავს, რომ ამ შემთხვევაში საზოგადოებას აქვს უფრო მეტი ბიოლოგიური მრავალფეროვნება, უფრო მრავალფეროვანია, ვიდრე მეორე. ასე რომ, მრუდი, რომელიც თავს იკავებდა გრაფიკის თავზე, უფრო მრავალფეროვანია, ხოლო მრუდი, რომელიც სხვების ქვემოთ არის, უფრო დაბალია. ბიომრავალფეროვნებაზე ანთროპოგენური ზემოქმედების გავლენის გასაანალიზებლად მესამე საინტერესო გზაა სიმრავლის ბიომასის მრუდები, ABC მოსახვევები. ამ მოსახვევებიდან შეგიძლიათ თვალყური ადევნოთ რა ეფექტებს. ამ მაგალითში თქვენ იხილავთ სამ სხვადასხვა თემს. ერთი არის შეუფერხებლად, მეორე ზომიერად შეშფოთებულია, მესამეზე მეტად შეწუხებულია. თუ x ღერძზე დააყენებთ სახეობების რანგს, ხოლო ეპსილონის ღერძზე, ბიომასას ან თითოეული სახეობის სიმრავლე, დაინახავთ, რომ შეუფერხებელ ადგილებში, ბიომასის მრუდი ყოველთვის არის სიმრავლის მრუდზე. ეს ნიშნავს, რომ სისტემის ბიომასა უფრო მაღალია, ვიდრე სახეობების ერთი რაოდენობა. შუალედური დარღვევის მხარეში თქვენ დაინახავთ, რომ ორი მრუდი მრავალჯერ გადაკვეთს. ეს ნიშნავს, რომ სიმრავლე შეიძლება ზოგჯერ უფრო მაღალი იყოს, ვიდრე ბიომასა და ეს იმიტომ ხდება, რომ ზოგიერთი სახეობა იზრდება სხვაზე უფრო სწრაფად, რადგან ადგილი დარღვეულია. მაგალითად, სხვა სახეობების მიხედვით, ეს არის ის მდგომარეობა, როდესაც თქვენ ხედავთ, რომ შეშფოთებულ მხარეში ადამიანების რიცხვი ძალიან დიდია, რადგან არსებობს პიონერული ან ინვაზიური სახეობები, რომლებიც შეიძლება ჩამოვიდნენ და შემდეგ სწრაფად გაიზარდონ, მაგრამ მათ არ შეუძლიათ ბევრი ბიომასის დაგროვება, ამიტომ ამ ორი კოდისა და ქცევის ანალიზი. ასე რომ, როდესაც ხედავთ, რომ ბიომასა უფრო მეტია, ვიდრე სიმრავლე, მაშინ მიხვდებით, რომ საიტი შეუფერხებელია. როდესაც ისინი ბევრჯერ გადაკვეთენ, ეს ზომიერად შეწუხებულია. და როდესაც სიმრავლის მრუდი უფრო მაღალია, ვიდრე ბიომასის მრუდი, შეუძლია გაიგოს საზოგადოება ძალიან შეშფოთებულია. ასევე არსებობს მათემატიკური მეთოდი, რომელიც გამოიყენება სტატისტიკისათვის ABC რიგებიდან, მრავალფეროვნებაზე ზემოქმედების გამოსათვლელად. და ამას ქვია W ინდექსი. და W ინდექსი ძალიან მარტივია, რადგან ის მხოლოდ Bi-Ai/50-ის ჯამია, გამრავლებული სისტემაში არსებული სახეობების რაოდენობაზე. Bi უბრალოდ არის რანგის i თითოეული სახეობის ბიომასა. და აი არის i რიგის თითოეული სახეობის ინდივიდების რაოდენობა. თქვენ უბრალოდ უნდა გაითვალისწინოთ, რომ აი და ბი შეიძლება მიმართონ სხვადასხვა რანგის სხვადასხვა სახეობას, რადგან ისინი განსხვავებულად არიან განლაგებული. ისინი ბიომასის ან ბიომრავალფეროვნების მიხედვით არიან. ყოველ შემთხვევაში, უფრო შეშფოთებული საიტებიდან, თქვენ გაქვთ ინდექსი, რომელიც უფრო მაღალია ნულამდე, რომ არის ზომიერად დარღვეული მხარე, ნეგატიური ინდექსები, რომლებიც დარღვეულია. ასე რომ, თუ თქვენი მნიშვნელობა, რომელსაც იღებთ W სტატისტიკური მონაცემებიდან, რომელსაც ეწოდება W ინდექსი, არის დადებითი, შეგიძლიათ თქვათ, რომ ეს მხარე შეუფერხებელია. თუ ის 0 -ის გარშემოა, გვერდი ზომიერად შეწუხებულია. და თუ ის უარყოფითია, ის დარწმუნებულია, რომ ის ძალიან შეწუხებულია. ბიომრავალფეროვნებაზე ზემოქმედების შეფასების მესამე გზა არის მეთოდები, რომლებიც დაფუძნებულია მრავალმხრივ ღონისძიებებზე. ეს შეთავაზებები, როგორც ძირითადი კომპონენტების ანალიზი ან ე.წ. PCA ან კოორდინატთა ანალიზი, მაგრამ ზოგჯერ ისინი შეზღუდული გამოყენებისაა. ჯობია გამოვიყენოთ ბეტა-მრავალფეროვნების ინდექსი, მაგალითად, თუ გვსურს გამოვიყენოთ მრავალმხრივი ღონისძიება. ჩვენ შეგვიძლია გამოვიყენოთ სორენსენი ან ჟაკარდი ან კიდევ უკეთესი ბრეი-კერტისი ან ჩაო-სორენსენი, ჩაო-ჟაკარდი, რომ შევაფასოთ საზოგადოებაზე არეულობის ეფექტი. ვინაიდან ამ მაჩვენებლებზე გავლენას ახდენს ყველაზე უხვი სახეობები, ძალიან მნიშვნელოვანია თითოეული სამკურნალო საშუალების გამეორებების რაოდენობის გაზრდა. მაგალითად, შეშფოთებული და არა შეწუხებული მხარე. და გამოიყენეთ ორივე ინციდენტი, ინდექსები, მაგალითად, ყოფნა, კვანძის გრძნობის მონაცემები და სიუხვე ინდექსებში. ასევე შესაძლებელია გამოითვალოს საზოგადოების დარღვევის რაიმე სახის ინდექსი ან IDC ან ბიოტიკური მთლიანობის ინდექსი, რომელსაც IBI ეწოდება. შეადარეთ ბეტა მრავალფეროვნების სტანდარტული დონე, რომ დაიხუროს არეულობები უბნებთან შეშფოთებულ ადგილებში. ასე რომ, ჩვენ შეგვიძლია განსხვავებული შედარება გვესმოდეს, თუ რამდენად დიდია გავლენა საზოგადოების ბიომრავალფეროვნებაზე. ასე რომ მადლობა ყურადღებისთვის და გნახავთ შემდეგ ლექციაზე.


სატესტო შედეგების სიკეთე განაწილების ტესტებისთვის

მე & rsquom გამოყენებით Minitab, რომელსაც შეუძლია შეამოწმოთ 14 ალბათობის განაწილება და ორი გარდაქმნა ერთდროულად. მოდით & rsquos შევხედოთ გამომავალს ქვემოთ. ჩვენ & rsquore ვეძებთ უფრო მაღალ p- ღირებულებებს Goodness-of-Fit ტესტის ცხრილში.

როგორც ველოდით, ნორმალური განაწილება არ შეესაბამება მონაცემებს. P- მნიშვნელობა 0.005-ზე ნაკლებია, რაც მიუთითებს იმაზე, რომ ჩვენ შეგვიძლია უარვყოთ ნულოვანი ჰიპოთეზა, რომ ეს მონაცემები მოყვება ნორმალურ განაწილებას.

ყუთ-კოქსის ტრანსფორმაციას და ჯონსონის ტრანსფორმაციას ორივე აქვს მაღალი p- ღირებულებები. თუ ჩვენ გვჭირდება მონაცემების გარდაქმნა ნორმალური განაწილების შესაბამისად, მაღალი p- მნიშვნელობები მიუთითებს იმაზე, რომ ჩვენ შეგვიძლია წარმატებით გამოვიყენოთ ეს გარდაქმნები. თუმცა, ჩვენ უგულებელვყოფთ გარდაქმნებს, რადგან ჩვენ გვსურს გამოვყოთ ჩვენი ალბათობის განაწილება და არა მისი გარდაქმნა.

ყველაზე მაღალი p- მნიშვნელობა არის ვაიბულის სამი პარამეტრიანი განაწილებისთვის (& gt0.500). სამი პარამეტრის ვეიბულისთვის LRT P არის მნიშვნელოვანი (0.000), რაც იმას ნიშნავს, რომ მესამე პარამეტრი მნიშვნელოვნად აუმჯობესებს მორგებას.

ლოგონორმალურ განაწილებას აქვს შემდეგი უმაღლესი p- მნიშვნელობა 0.345.

მოდით & rsquos განვიხილოთ ვეიბულის სამი პარამეტრიანი განაწილება და ლოგნორმალური განაწილება ჩვენი საუკეთესო ორი კანდიდატია.


უნივერსალური მოდელი პოლიმერულ გელებში ელასტიურობის ლოგალური განაწილებისა და მისი შესაბამისობა ბიოლოგიური ქსოვილების მექანიკურ ხელმოწერასთან

მე გადავხედე ხელნაწერს "უნივერსალური მოდელი ჟურნალის ნორმალური ქსოვილებისთვის" დოქტორ არნო მილეტის მიერ. ძირითადად, ავტორი ემყარება იმ დასკვნას, რომ ახალგაზრდა მოდულის უნივერსალური ლოგ-ნორმალური განაწილება დაფიქსირებულია AFM ექსპერიმენტებით, რომლებიც ტარდება ელასტიური გელებით (ასიმილირებული ბიოლოგიურ ქსოვილებთან).

ეს ქცევა არ შეიძლება აიხსნას გერის ზრდის კინემატიკაზე დაფუძნებული ევრისტიკული არგუმენტებით. უფრო მეტიც, ავტორი ადაპტირებს ელასტიური გელის გამჟღავნებულ მოდელს, რომელიც მითითებულია ხელნაწერში მე –18 მითითებად (თუმცა, ცნობების ჩამონათვალი შემოიფარგლება 11 – ით).

წინამდებარე კვლევის სიახლეა ელასტიური მოდულის უნივერსალური ქცევის გამოყენება (განტოლება 11, ტექსტში), ექსპერიმენტულად დაკვირვებული (მითითება 19, არ არის ჩამოთვლილი პროექტში). კანტორისა და ვებმანის მოდელის გამოყენებით (მითითება 20, ჩამოთვლილი არ არის), ავტორი ირწმუნება, რომ ექსპონენტს f აქვს ნორმალური სივრცითი განაწილება, რაც იძლევა ელასტიური მოდულის ნორმალურ განაწილებას. აქედან გამომდინარე, ელასტიური მოდულის ლოგ-ნორმალური განაწილების უნივერსალურობა, ვინაიდან ეს ძალაუფლების დამოკიდებულება (ექვივალენტი 11 ან 13) არის უნივერსალური (პერკოლაციის მოდელის თვისება).

მე მაქვს გარკვეული დათქმები ფარულ დაშვებასთან დაკავშირებით, როგორც ექსპერიმენტული გაზომვის, ასევე სამოდელო მიდგომის ქვეშ.

(1) ექსპერიმენტული მონაცემები. ვარაუდობენ, რომ ექსპერიმენტულ გელს აქვს წრფივი ქცევა (მცირე დეფორმაცია, ხაზოვანი კონსტიტუციური ურთიერთობა, რაც გულისხმობს ჰერცის ფორმულის გამოყენებას).

(2) ანალოგიურად, მოდელი (ექვ. 12 ნახაზში) მოქმედებს მცირე ზომის კვანძების გადაადგილებისთვის ან ბმის მოსახვევისთვის. დატკეპნის მოდელი ეყრდნობა არა ობლიგაციების მოხრა/გაჭიმვას, არამედ ობლიგაციების შეერთებას.

ამიტომ, მე ეჭვი მაქვს, რომ უნივერსალური ქცევა, როგორც ეს მოცემულია ამ პროექტში, გამომდინარეობს ექსპერიმენტული დაკვირვებისა და მოდელის ანალიზის ხაზოვანი რეჟიმიდან.

საინტერესო იქნებოდა იმის შემოწმება, შეცვლის თუ არა მასალის არაწრფივობა (ან მისი ანიზოტროპია ბოჭკოებისა და მოგრძო სტრუქტურების არსებობის გამო) ხაზოვანი რეჟიმით ჩატარებული დაკვირვებების შედეგად მიღებულ დასკვნას.

ამას უდიდესი მნიშვნელობა ექნება ფაქტობრივი უჯრედებისთვის, რადგან ცნობილია, რომ რეალურ უჯრედებს შეუძლიათ განიცადონ დიდი დეფორმაციები (ვიფიქროთ, რომ უჯრედი გადის კომპაქტურ ქსოვილში), რაც გულისხმობს დაძაბულობა-სტრესის ურთიერთობის არაწრფივი ქცევას. გარდა ამისა, მნიშვნელოვანი იქნება ბოჭკოების (სტრესის ბოჭკოების) და სტრუქტურების არსებობა უჯრედებში. ამრიგად, სასრული ელემენტის მოდელების გამოყენებით საკონტაქტო მექანიკა AFM წვერსა და უჯრედს შორის, კონტაქტის გეომეტრია, დიდი დეფორმაცია და ჰიპერრელასტიკური მოდელი შესასწავლად სასიამოვნო დამატება იქნებოდა.

Გთხოვთ იხილოთ დანართი.

ბიოლოგიასთან კომუნიკაციის სახით წარმოდგენილი ეს ხელნაწერი ძალიან კარგად არის შედგენილი, თუმცა, მოცულობა შეიძლება ოდნავ მოშორდეს ჟურნალს. მიუხედავად იმისა, რომ მათემატიკური მოდელები წარმოდგენილია უჯრედული მატრიცის ელასტიურობის ჟურნალის ნორმალური ქცევის საჩვენებლად, მე მაქვს ძირითადი შეშფოთება ექსპერიმენტულ მოდელზე, რომელიც ქვემოთ არის წარმოდგენილი.

  1. რატომ გადაწყვიტა ავტორმა უჯრედების დათესვა გელის თავზე და დაელოდა უჯრედის შემოჭრას გელის მატრიცაში დიფერენციაციის ფაზაში? გელის შიგნით უჯრედების შეფუთვას შეუძლია მიბაძოს ფაქტობრივი 3D უჯრედულ გარემოს უჯრედული პროცესების დაწყებისთანავე და უფრო აქტუალური გახადოს ავტორის მტკიცება ქსოვილის გამარტივებული მოდელის შესახებ.
  2. მე მინდა, რომ ავტორმა ნათლად განსაზღვროს AFM კვლევებისთვის ნიმუშის მომზადება მეთოდის განყოფილებაში. გელის ნიმუშები გამხმარი იყო AFM კვლევების დაწყებამდე? ასევე, გთხოვთ, მიუთითოთ AFM რეჟიმი, რომელიც გამოიყენება მექანიკური მონაცემების მოსაპოვებლად?
  3. გთხოვთ, შეიტანოთ ინფორმაცია იმის შესახებ, თუ რა სარგებელს მოუტანს ამ კვლევის შედეგები კიბოს კვლევას, რადგან შესავალი ნაწილი ამ კონკრეტულ თემაზე დომინირებს. კიბოს დინამიური და არაერთგვაროვანი მიკრო გარემოს გათვალისწინებით, აქ წარმოდგენილი ექსპერიმენტული მოდელი არ არის კომპეტენტური და შესაბამისი.

Გთხოვთ იხილოთ დანართი.

მე კმაყოფილი ვარ ავტორის პასუხით და სიამოვნებით გირჩევთ მას განსახილველად.


ნდობის ზღვარი

მას შემდეგ რაც გამოთვალეთ დაკვირვებების მთელი საშუალო რიცხვი, თქვენ უნდა მიუთითოთ რამდენად სავარაუდოა თქვენი სავარაუდო მაჩვენებელი პარამეტრულ ("ჭეშმარიტ") საშუალოზე. ამის ერთ -ერთი გზა არის ნდობის შეზღუდვები. კონფიდენციალურობის ლიმიტები არის რიცხვები ნდობის ინტერვალის ზედა და ქვედა ბოლოს, მაგალითად, თუ თქვენი საშუალო არის 7.4 ნდობის ზღვრებით 5.4 და 9.4, თქვენი ნდობის ინტერვალი არის 5.4 -დან 9.4 -მდე. ადამიანების უმეტესობა იყენებს 95% ნდობის ლიმიტებს, თუმცა თქვენ შეგიძლიათ გამოიყენოთ სხვა ღირებულებები. ნდობის 95% ლიმიტების დადგენა ნიშნავს იმას, რომ თუ თქვენ აიღებთ განმეორებით შემთხვევით ნიმუშებს პოპულაციიდან და გამოითვლით საშუალო და ნდობის ზღვარს თითოეული ნიმუშისთვის, თქვენი ნიმუშების 95% –ის ნდობის ინტერვალი მოიცავს პარამეტრულ საშუალო მაჩვენებელს.

ამის საილუსტრაციოდ, აქ არის პოპულაციის 3 დაკვირვების 100 ნიმუშის საშუალება და ნდობის ინტერვალი მოსახლეობიდან, რომლის პარამეტრია 5. პარამეტრული საშუალო მათი 95% ნდობის ინტერვალის ფარგლებში, ხოლო 6 (ნაჩვენებია წრეებითა და სქელი ხაზებით) აქვს პარამეტრული საშუალო ნდობის ინტერვალის გარეთ.

უფრო დიდი ნიმუშის ზომებით, 95% ნდობის ინტერვალი მცირდება:

როდესაც თქვენ გამოითვლით ნდობის ინტერვალს ერთი ნიმუშისთვის, მაცდურია იმის თქმა, რომ "არის 95% ალბათობა, რომ ნდობის ინტერვალი მოიცავს პარამეტრულ საშუალოს". ეს ტექნიკურად არასწორია, რადგან ის გულისხმობს იმას, რომ თუ თქვენ შეაგროვებთ ნიმუშებს იგივე ნდობის ინტერვალით, ზოგჯერ ისინი შეიცავდნენ პარამეტრულ საშუალოს და ზოგჯერ არა. მაგალითად, ფიგურის პირველ ნიმუშს აქვს ნდობის ლიმიტები 4.59 და 5.51. არასწორი იქნება იმის თქმა, რომ დროის 95%, ამ მოსახლეობის პარამეტრული საშუალო იქნება 4.59 - დან 5.51 - მდე. თუ თქვენ აიღებდით განმეორებით ნიმუშებს იმავე პოპულაციიდან და არაერთხელ მიიღებდით ნდობის ლიმიტებს 4.59 და 5.51, პარამეტრული საშუალო (რაც არის 5, დაიმახსოვრეთ) ამ ინტერვალში იქნებოდა დროის 100%. ზოგიერთ სტატისტიკოსს არ აინტერესებს ეს დამაბნეველი, პედანტური განსხვავება, მაგრამ სხვები ძალიან არჩევენ მას, ამიტომ კარგია ამის ცოდნა.

კონფიდენციალურობის ლიმიტები გაზომვის ცვლადებისთვის

გაზომვის ცვლადის ნდობის ლიმიტების გამოსათვლელად, გავამრავლოთ საშუალო სტანდარტული ცდომილება შესაბამის t- მნიშვნელობაზე. T- მნიშვნელობა განისაზღვრება ალბათობით (0.05 95% ნდობის ინტერვალისთვის) და თავისუფლების ხარისხით (n & minus1). ცხრილში შეგიძლიათ გამოიყენოთ = (STDEV (Ys)/SQRT (COUNT (Ys)))*TINV (0.05, COUNT (Ys) -1), სადაც Ys არის თქვენი მონაცემების შემცველი უჯრედების დიაპაზონი. თქვენ დაამატებთ ამ მნიშვნელობას და გამოაკლებთ მას საშუალო ნდობის ლიმიტების მისაღებად. ამრიგად, თუ საშუალო არის 87 და t- მნიშვნელობა სტანდარტულ შეცდომას შეადგენს 10.3, ნდობის ზღვარი იქნება 76.7 და 97.3. თქვენ ასევე შეგიძლიათ შეატყობინოთ ამას როგორც "87 & plusmn10.3 (95% ნდობის ლიმიტი)". ხალხი აცხადებს როგორც ნდობის ლიმიტებს, ასევე სტანდარტულ შეცდომებს, როგორც "ნიშნავს და პლუს რაღაცას", ასე რომ ყოველთვის დარწმუნდით, რომ მიუთითეთ რაზეა საუბარი.

ყოველივე ზემოთქმული ეხება მხოლოდ ნორმალურად განაწილებულ გაზომვის ცვლადებს. უაღრესად ნორმალური განაწილების მონაცემების გაზომვისთვის ჩატვირთვის ტექნიკას, რაზეც აქ არ ვისაუბრებ, შეიძლება ნდობის ლიმიტების უკეთესი შეფასება.

ნდობის ლიმიტები ნომინალური ცვლადებისთვის

არსებობს განსხვავებული, უფრო რთული ფორმულა, რომელიც დაფუძნებულია ბინომინალურ განაწილებაზე, პროპორციების ნდობის ლიმიტების გამოსათვლელად (ნომინალური მონაცემები). რაც მთავარია, ის იძლევა ნდობის ზღვარს, რომელიც არ არის სიმეტრიული პროპორციის გარშემო, განსაკუთრებით პროპორციებისთვის ნულოვან ან ერთთან ახლოს. ჯონ პეცულოს აქვს ადვილად გამოსაყენებელი ვებ გვერდი პროპორციის ნდობის ინტერვალებისთვის. To see how it works, let's say that you've taken a sample of 20 men and found 2 colorblind and 18 non-colorblind. Go to the web page and enter 2 in the "Numerator" box and 20 in the "Denominator" box," then hit "Compute." The results for this example would be a lower confidence limit of 0.0124 and an upper confidence limit of 0.3170. You can't report the proportion of colorblind men as "0.10 ± something," instead you'd have to say "0.10 with 95% confidence limits of 0.0124 and 0.3170."

An alternative technique for estimating the confidence limits of a proportion assumes that the sample proportions are normally distributed. This approximate technique yields symmetrical confidence limits, which for proportions near zero or one are obviously incorrect. For example, if you calculate the confidence limits using the normal approximation on 0.10 with a sample size of 20, you get -0.03 and 0.23, which is ridiculous (you couldn't have less than 0% of men being color-blind). It would also be incorrect to say that the confidence limits were 0 and 0.23, because you know the proportion of colorblind men in your population is greater than 0 (your sample had two colorblind men, so you know the population has at least two colorblind men). I consider confidence limits for proportions that are based on the normal approximation to be obsolete for most purposes you should use the confidence interval based on the binomial distribution, unless the sample size is so large that it is computationally impractical. Unfortunately, more people use the confidence limits based on the normal approximation than use the correct, binomial confidence limits.

The formula for the 95% confidence interval using the normal approximation is p ±1.96&radic[p(1-p)/n], where გვ is the proportion and n is the sample size. ამრიგად, იმისთვის =0.20 and n=100, the confidence interval would be ±1.96&radic[0.20(1-0.20)/100], or 0.20±0.078. A common rule of thumb says that it is okay to use this approximation as long as npq is greater than 5 my rule of thumb is to only use the normal approximation when the sample size is so large that calculating the exact binomial confidence interval makes smoke come out of your computer.

Statistical testing with confidence intervals

This handbook mostly presents "classical" or "frequentist" statistics, in which hypotheses are tested by estimating the probability of getting the observed results by chance, if the null is true (the ღირებულება). An alternative way of doing statistics is to put a confidence interval on a measure of the deviation from the null hypothesis. For example, rather than comparing two means with a two-sample &ndashtest, some statisticians would calculate the confidence interval of the difference in the means.

This approach is valuable if a small deviation from the null hypothesis would be uninteresting, when you're more interested in the size of the effect rather than whether it exists. For example, if you're doing final testing of a new drug that you're confident will have some effect, you'd be mainly interested in estimating how well it worked, and how confident you were in the size of that effect. You'd want your result to be "This drug reduced systolic blood pressure by 10.7 mm Hg, with a confidence interval of 7.8 to 13.6," not "This drug significantly reduced systolic blood pressure (=0.0007)."

Using confidence limits this way, as an alternative to frequentist statistics, has many advocates, and it can be a useful approach. However, I often see people saying things like "The difference in mean blood pressure was 10.7 mm Hg, with a confidence interval of 7.8 to 13.6 because the confidence interval on the difference does not include 0, the means are significantly different." This is just a clumsy, roundabout way of doing hypothesis testing, and they should just admit it and do a frequentist statistical test.

There is a myth that when two means have confidence intervals that overlap, the means are not significantly different (at the <0.05 level). Another version of this myth is that if each mean is outside the confidence interval of the other mean, the means are significantly different. Neither of these is true (Schenker and Gentleman 2001, Payton et al. 2003) it is easy for two sets of numbers to have overlapping confidence intervals, yet still be significantly different by a two-sample &ndashtest conversely, each mean can be outside the confidence interval of the other, yet they're still not significantly different. Don't try compare two means by visually comparing their confidence intervals, just use the correct statistical test.

Similar statistics

Confidence limits and standard error of the mean serve the same purpose, to express the reliability of an estimate of the mean. When you look at scientific papers, sometimes the "error bars" on graphs or the ± number after means in tables represent the standard error of the mean, while in other papers they represent 95% confidence intervals. I prefer 95% confidence intervals. When I see a graph with a bunch of points and error bars representing means and confidence intervals, I know that most (95%) of the error bars include the parametric means. When the error bars are standard errors of the mean, only about two-thirds of the bars are expected to include the parametric means I have to mentally double the bars to get the approximate size of the 95% confidence interval (because t(0.05) is approximately 2 for all but very small values of n). Whichever statistic you decide to use, be sure to make it clear what the error bars on your graphs represent. A surprising number of papers don't say what their error bars represent, which means that the only information the error bars convey to the reader is that the authors are careless and sloppy.

მაგალითები

Measurement data: The blacknose dace data from the central tendency web page has an arithmetic mean of 70.0. The lower confidence limit is 45.3 (70.0&minus24.7), and the upper confidence limit is 94.7 (70+24.7).

Nominal data: If you work with a lot of proportions, it's good to have a rough idea of confidence limits for different sample sizes, so you have an idea of how much data you'll need for a particular comparison. For proportions near 50%, the confidence intervals are roughly ±30%, 10%, 3%, and 1% for n=10, 100, 1000, and 10,000, respectively. This is why the "margin of error" in political polls, which typically have a sample size of around 1,000, is usually about 3%. Of course, this rough idea is no substitute for an actual power analysis.

nproportion=0.10proportion=0.50
100.0025, 0.44500.1871, 0.8129
1000.0490, 0.17620.3983, 0.6017
10000.0821, 0.12030.4685, 0.5315
10,0000.0942, 0.10600.4902, 0.5098

How to calculate confidence limits

Spreadsheets

The descriptive statistics spreadsheet calculates 95% confidence limits of the mean for up to 1000 measurements. The confidence intervals for a binomial proportion spreadsheet calculates 95% confidence limits for nominal variables, using both the exact binomial and the normal approximation.

ვებ გვერდები

This web page calculates confidence intervals of the mean for up to 10,000 measurement observations. The web page for confidence intervals of a proportion handles nominal variables.

სალვატორე მანგიაფიკოს რ კომპანიონი has sample R programs for confidence limits for both measurement and nominal variables.

To get confidence limits for a measurement variable, add CIBASIC to the PROC UNIVARIATE statement, like this:

The output will include the 95% confidence limits for the mean (and for the standard deviation and variance, which you would hardly ever need):

This shows that the blacknose dace data have a mean of 70, with confidence limits of 45.3 and 94.7.

You can get the confidence limits for a binomial proportion using PROC FREQ. Here's the sample program from the exact test of goodness-of-fit page:

And here is part of the output:

The first pair of confidence limits shown is based on the normal approximation the second pair is the better one, based on the exact binomial calculation. Note that if you have more than two values of the nominal variable, the confidence limits will only be calculated for the value whose name is first alphabetically. For example, if the Gus data set included "left," "right," and "both" as values, SAS would only calculate the confidence limits on the proportion of "both." One clumsy way to solve this would be to run the program three times, changing the name of "left" to "aleft," then changing the name of "right" to "aright," to make each one first in one run.

ცნობები

Payton, M. E., M. H. Greenstone, and N. Schenker. 2003. Overlapping confidence intervals or standard error intervals: what do they mean in terms of statistical significance? Journal of Insect Science 3: 34.

Schenker, N., and J. F. Gentleman. 2001. On judging the significance of differences by examining overlap between confidence intervals. American Statistician 55: 182-186.

&lArr Previous topic|Next topic &rArr Სარჩევი

This page was last revised July 20, 2015. Its address is http://www.biostathandbook.com/confidence.html. It may be cited as:
მაკდონალდსი, ჯ.ჰ. 2014. Handbook of Biological Statistics (3rd ed.). Sparky House Publishing, Baltimore, Maryland. This web page contains the content of pages 115-120 in the printed version.

©2014 by John H. McDonald. You can probably do what you want with this content see the permissions page for details.


შეცდომის ანალიზი

One of the most used assumption of normality is in error analysis. We usually assume that the random errors follow a normal distribution. This assumption can break down when there are multiple sources of errors and they are correlated. In addition, if the errors are not truly random, then too this assumption might not be valid. If the error distribution is not normal and the assumption of normality is made, then there could lead to an incorrect statistical analysis and thus erroneous conclusions.


Spearman rank correlation

Use Spearman rank correlation to test the association between two ranked variables, or one ranked variable and one measurement variable. You can also use Spearman rank correlation instead of linear regression/correlation for two measurement variables if you're worried about non-normality, but this is not usually necessary.

როდის გამოვიყენოთ

Use Spearman rank correlation when you have two ranked variables, and you want to see whether the two variables covary whether, as one variable increases, the other variable tends to increase or decrease. You also use Spearman rank correlation if you have one measurement variable and one ranked variable in this case, you convert the measurement variable to ranks and use Spearman rank correlation on the two sets of ranks.

For example, Melfi and Poyser (2007) observed the behavior of 6 male colobus monkeys (Colobus guereza) in a zoo. By seeing which monkeys pushed other monkeys out of their way, they were able to rank the monkeys in a dominance hierarchy, from most dominant to least dominant. This is a ranked variable while the researchers know that Erroll is dominant over Milo because Erroll pushes Milo out of his way, and Milo is dominant over Fraiser, they don't know whether the difference in dominance between Erroll and Milo is larger or smaller than the difference in dominance between Milo and Fraiser. After determining the dominance rankings, Melfi and Poyser (2007) counted eggs of Trichuris nematodes per gram of monkey feces, a measurement variable. They wanted to know whether social dominance was associated with the number of nematode eggs, so they converted eggs per gram of feces to ranks and used Spearman rank correlation.

Some people use Spearman rank correlation as a non-parametric alternative to linear regression and correlation when they have two measurement variables and one or both of them may not be normally distributed this requires converting both measurements to ranks. Linear regression and correlation that the data are normally distributed, while Spearman rank correlation does not make this assumption, so people think that Spearman correlation is better. In fact, numerous simulation studies have shown that linear regression and correlation are not sensitive to non-normality one or both measurement variables can be very non-normal, and the probability of a false positive (<0.05, when the null hypothesis is true) is still about 0.05 (Edgell and Noon 1984, and references therein). It's not incorrect to use Spearman rank correlation for two measurement variables, but linear regression and correlation are much more commonly used and are familiar to more people, so I recommend using linear regression and correlation any time you have two measurement variables, even if they look non-normal.

Ნულოვანი ჰიპოთეზა

The null hypothesis is that the Spearman correlation coefficient, &rho ("rho"), is 0. A &rho of 0 means that the ranks of one variable do not covary with the ranks of the other variable in other words, as the ranks of one variable increase, the ranks of the other variable do not increase (or decrease).

Assumption

When you use Spearman rank correlation on one or two measurement variables converted to ranks, it does not assume that the measurements are normal or homoscedastic. It also doesn't assume the relationship is linear you can use Spearman rank correlation even if the association between the variables is curved, as long as the underlying relationship is monotonic (as X gets larger, Y keeps getting larger, or keeps getting smaller). If you have a non-monotonic relationship (as X gets larger, Y gets larger and then gets smaller, or Y gets smaller and then gets larger, or something more complicated), you shouldn't use Spearman rank correlation.

Like linear regression and correlation, Spearman rank correlation assumes that the observations are independent.

როგორ მუშაობს ტესტი

Spearman rank correlation calculates the value the same way as linear regression and correlation, except that you do it on ranks, not measurements. To convert a measurement variable to ranks, make the largest value 1, second largest 2, etc. Use the average ranks for ties for example, if two observations are tied for the second-highest rank, give them a rank of 2.5 (the average of 2 and 3).

When you use linear regression and correlation on the ranks, the Pearson correlation coefficient () is now the Spearman correlation coefficient, &rho, and you can use it as a measure of the strength of the association. For 11 or more observations, you calculate the test statistic using the same equation as for linear regression and correlation, substituting &rho for : = &radic d.f.×&rho 2 / &radic (1&minus&rho 2 )  . If the null hypothesis (that &rho=0) is true, is t-distributed with n&minus2 degrees of freedom.

If you have 10 or fewer observations, the value calculated from the t-distribution is somewhat inaccurate. In that case, you should look up the value in a table of Spearman t-statistics for your sample size. My Spearman spreadsheet does this for you.

You will almost never use a regression line for either description or prediction when you do Spearman rank correlation, so don't calculate the equivalent of a regression line.

For the Colobus monkey example, Spearman's &rho is 0.943, and the value from the table is less than 0.025, so the association between social dominance and nematode eggs is significant.

მაგალითი

Males of the magnificent frigatebird (Fregata magnificens) have a large red throat pouch. They visually display this pouch and use it to make a drumming sound when seeking mates. Madsen et al. (2004) wanted to know whether females, who presumably choose mates based on their pouch size, could use the pitch of the drumming sound as an indicator of pouch size. The authors estimated the volume of the pouch and the fundamental frequency of the drumming sound in 18 males.

There are two measurement variables, pouch size and pitch. The authors analyzed the data using Spearman rank correlation, which converts the measurement variables to ranks, and the relationship between the variables is significant (Spearman's rho=-0.76, 16 d.f., =0.0002). The authors do not explain why they used Spearman rank correlation if they had used regular correlation, they would have obtained =-0.82, =0.00003.

შედეგების გრაფიკირება

You can graph Spearman rank correlation data the same way you would for a linear regression or correlation. Don't put a regression line on the graph, however it would be misleading to put a linear regression line on a graph when you've analyzed it with rank correlation.

როგორ გავაკეთოთ ტესტი

ცხრილები

I've put together a spreadsheet that will perform a Spearman rank correlation on up to 1000 observations. With small numbers of observations (10 or fewer), the spreadsheet looks up the value in a table of critical values.

Web page

This web page will do Spearman rank correlation.

სალვატორე მანგიაფიკოს რ კომპანიონი has a sample R program for Spearman rank correlation.

Use PROC CORR with the SPEARMAN option to do Spearman rank correlation. Here is an example using the bird data from the correlation and regression web page:

The results include the Spearman correlation coefficient &rho, analogous to the value of a regular correlation, and the მნიშვნელობა:

ცნობები

Picture of magnificent frigatebird from CalPhoto, by Lloyd Glenn Ingles, © California Academy of Sciences.

Edgell, S.E., and S.M. Noon. 1984. Effect of violation of normality on the &ndashtest of the correlation coefficient. Psychological Bulletin 95: 576-583.

Madsen, V., T.J.S. Balsby, T. Dabelsteen, and J.L. Osorno. 2004. Bimodal signaling of a sexually selected trait: gular pouch drumming in the magnificent frigatebird. Condor 106: 156-160.

Melfi, V., and F. Poyser. 2007 წ. Trichuris burdens in zoo-housed Colobus guerezaრა International Journal of Primatology 28: 1449-1456.

&lArr Previous topic|Next topic &rArr Სარჩევი

This page was last revised July 20, 2015. Its address is http://www.biostathandbook.com/spearman.html. It may be cited as:
მაკდონალდსი, ჯ.ჰ. 2014. Handbook of Biological Statistics (3rd ed.). Sparky House Publishing, Baltimore, Maryland. This web page contains the content of pages 209-212 in the printed version.

©2014 by John H. McDonald. You can probably do what you want with this content see the permissions page for details.


Bell Curve Example

A good example of a bell curve or normal distribution is the roll of two dice. The distribution is centered around the number seven and the probability decreases as you move away from the center.

Here is the percent chance of the various outcomes when you roll two dice.

  • Two: (1/36) 2.78%
  • Three: (2/36) 5.56%
  • Four: (3/36) 8.33%
  • Five: (4/36) 11.11%
  • Six: (5/36) 13.89%
  • Seven: (6/36) 16.67% = most likely outcome
  • Eight: (5/36) 13.89%
  • Nine: (4/36) 11.11%
  • Ten: (3/36) 8.33%
  • Eleven: (2/36) 5.56%
  • Twelve: (1/36) 2.78%

Normal distributions have many convenient properties, so in many cases, especially in physics and astronomy, random variations with unknown distributions are often assumed to be normal to allow for probability calculations. Although this can be a dangerous assumption, it is often a good approximation due to a surprising result known as the central limit theorem.

This theorem states that the mean of any set of variants with any distribution having a finite mean and variance tends to occur in a normal distribution. Many common attributes such as test scores or height follow roughly normal distributions, with few members at the high and low ends and many in the middle.


Უყურე ვიდეოს: How to perform a Biological Evaluation of your Medical Devices? (დეკემბერი 2021).