जरी वक्र समान दिसत असले तरी काची आणि गौसीच्या वितरणामध्ये काय फरक आहे?


उत्तर 1:

काची सामान्यसारखे दिसत नाही. काची नक्की कसे दिसते हे आपण वापरत असलेल्या पॅरामीटर्सवर अवलंबून आहे, परंतु ते सामान्य दिसत नाही.

उदा

सेट.सीड (१२3434) # एक यादृच्छिक संख्या बियाणे x1 <- आरकॉची (१०००, ०, १) x2 <- आरएनॉर्म (१०००, म्हणजेच (एक्स १), एसडी (एक्स १)) प्लॉट (घनता (एक्स १)) प्लॉट (घनता) (x2))

मुळीच एकसारखे पाहू नका. आणि एक्स 1 -178 ते 702 पर्यंत आहे तर एक्स 2 -76 ते 71 पर्यंत आहे.


उत्तर 2:

आपण पहातच आहात की, दोन्ही वक्र समान दिसतात की त्या दोघांमध्ये एकच “दणका” आहे आणि आपण जितके पुढे आहात तितके लहान पसरले आहेत. ते वेगळे आहेत की काचीकडे एक अरुंद पीक आहे आणि हळूहळू ते पसरते - सामान्य वितरणाच्या तुलनेत शिखरावरुन मूल्ये मिळण्याची मोठी शक्यता असते. हा फरक गणितानुसार बरेच भिन्न परिणाम प्राप्त करतो - जसे की काची एक योग्य परिभाषित मूळ मूल्य नसते आणि "मोठ्या संख्येचा कायदा" लागू होत नाही अशा ठिकाणी विशिष्ट नमुना वितरण आहे.


उत्तर 3:

जरी वक्र समान दिसत असले तरी काची आणि गौसीच्या वितरणामध्ये काय फरक आहे?

वरवर पाहता, ते समान दिसत आहेत. परंतु मला वितरणाच्या घनतेच्या कार्याचा आलेख दर्शवा आणि ते सांगा की तो एकतर काउची किंवा गौसी आहे, मला माहित होईल (ते खरोखर त्यापैकी एक होते असे गृहीत धरून). काउचीला पुष्कळ लांब शेपटी आहेत.

जेव्हा आमच्याकडे अज्ञात पॅरामीटर्ससह वितरणाचे कुटुंब असते, तेव्हा आम्ही त्या पॅरामीटर्सचा अंदाज करू इच्छितो.

  • गौसियन वितरणामध्ये दोन पॅरामीटर्स आहेत, मध्यम आणि प्रमाणित विचलन. त्याऐवजी आम्ही इतर पॅरामीटर्स वापरू शकलो, उदाहरणार्थ मेडियन (जे मध्यभागी आहे) आणि अर्ध-अंतर्देशीय श्रेणी (जे जवळपास आहे
  • 0.67450.6745
  • प्रमाणित विचलनाचा वेळा) .कौचि वितरणाचा अर्थ अस्तित्वात नाही, परंतु मध्यम सममितीचे केंद्र आहे. प्रमाण विचलन एकतर अस्तित्त्वात नाही, परंतु मध्यम पासून चौरस विचलनाची सरासरी असीम आहे.

तर हाच मुख्य फरक आहे. आम्ही दोन्हीपैकी एकतर वितरणाचे मापदंड मध्यम आणि अर्ध-अंतर्देशीय श्रेणी म्हणून घेऊ शकतो, परंतु काचेचे अस्तित्वात नसल्यामुळे आम्ही मूळ आणि प्रमाणित विचलन वापरू शकत नाही.

वितरणाच्या पॅरामीटर्सचा अंदाज लावण्यास मदत करण्यासाठी जेव्हा आम्ही एखादा नमुना घेतो तेव्हा आम्ही नमुन्यांची मूल्ये सरासरी आणि प्रमाणित विचलनासारख्या आकडेवारीची गणना करतो. या आकडेवारीत वितरण आहे. नमुना सांख्यिकीचे वितरण त्याचे नमुना वितरण म्हणून ओळखले जाते.

  • जर लोकसंख्येचे वितरण गौसी असेल तर (नमुना वितरण) नमुना म्हणजे देखील गौसी आहे आणि त्याचे प्रमाण खूपच लहान आहे, म्हणून एक मोठा नमुना फक्त एक निरीक्षण घेण्यापेक्षा अधिक अचूक अंदाज देते. वितरण काची असल्यास, नमुना म्हणजेच काची वितरण देखील असते, परंतु मूळ वितरणासारखे अगदी मध्यम आणि अर्ध-अंतर्भागातील श्रेणी असते. सॅम्पलचा अर्थ घेण्यास काहीच फायदा नाही.

तर तो आणखी एक फरक आहे. गौसीच्या नमुन्याचा अर्थ मध्य (किंवा मध्यम) अंदाजासाठी उपयुक्त आहे; काचीसाठीच्या नमुन्याचा अर्थ मध्यकाच्या अनुमानासाठी निरुपयोगी आहे. नमुना मध्यम वापरणे चांगले आहे, जे अधिक अचूक अंदाज देते.

तत्सम वितर्क कोणत्याही वितरणाच्या प्रसाराचे अंदाज लावण्यासाठी (तथापि आपण ते परिभाषित करता) लागू करतात. गौसी वितरणासाठी नेहमीचे अंदाज कॉची वितरणासाठी कार्य करत नाहीत.

वास्तविक फरक म्हणजे घनतेच्या गणिताच्या सूत्रात. प्रमाणित स्वरूपात गौशियनची घनता असते

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

आणि काचीची घनता आहे

1π(1+z2)\frac1{\pi(1+z^2)}

.

दोन लक्षात घ्या

zz

s भिन्न आहेत. पहिल्या प्रकरणात मानक विचलन आहे

11

, दुसर्‍या प्रकरणात वरचा चतुर्थांश आहे

11

.

वितरण कार्य (संभाव्यता की

ZzZ\le z

) गौसी वितरणासाठी व्यवस्थित बंद फॉर्म नाही, परंतु तो काचीसाठी आहे, तो आहे

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

फरक पाहण्यासाठी आपल्याला समान अक्षांवर वितरण आलेख करायचे असल्यास, पॅरामीटर्स जुळविणे आवश्यक आहे. तर मी गौशियनचे मानकीकरण करीन जेणेकरून खालच्या आणि वरच्या भागांचे भाग असतील

0.6745-0.6745

आणि

0.67450.6745

, म्हणजेच प्रमाण विचलनास समान बनवा

1.48261.4826

आणि काचीसाठी मानक फॉर्म वापरा. आलेखाखालील क्षेत्र समान असले पाहिजेत, म्हणून मध्यभागी असलेल्या उंची योग्य प्रमाणात मोजल्या पाहिजेत (

0.2690.269

गौसी आणि साठी

0.3180.318

काउचीसाठी - काची मध्यभागी उंच आहे आणि शेपटीत जास्त आहे).