فرایند دیریکله

دانشنامه عمومی

در نظریه احتمالات فرایند دیریکله، که به یاد پیتر گاستاو دریکله نامیده شده است، یک دسته ازفرایند تصادفی است. این فرایند یک توزیع روی توزیع هاست. به عبارت دیگر یک فرایند دریکله یک توزیع احتمالاتی است که بازه آن خود یک مجموعه از احتمالات است. این فرایند غالباً در استنتاج بیزی استفاده می شود که اطلاعات اولیه در مورد توزیع متغیرهای تصادفی را توصیف می کند. - احتمال این که متغیرهای تصادفی با یک یا چند توزیع مشخص توزیع شوند.
یک فرایند دیریکله با D P ( H , α ) مشخص می شود که در آن H توزیع پایه است وعدد حقیقی α ، پارامتر تراکم نامیده می شود. توزیع پایه، امید ریاضی فرایند است. اگرچه توزیع پایه یعنی H پیوسته است، اما مقادیر ایجاد شده توسط فرایند دیریکله به صورت قریب به یقین گسسته هستند. پارامتر تراکم بیانگر این است که جداسازی به چه میزان قوی است: در حد α → 1 ادراک در یک نقطه خاص متمرکز می شوند. در حالی که در حد α → ∞ ، ادراک پیوسته خواهند شد. بین دو حد ادراک به صورت توزیع های گسسته با تمرکز کم وجود دارند و با کاهش تمرکز را با کاهش α شاهد هستیم. اینکه احتمال اینکه مقادیر تکرار شوند، چقدر است بستگی به پارامتر α دارد.
توجه کنید که فرایند دیریکله یک فرایند تصادفی است؛ یعنی تشکیل شده از بی نهایت متغیر تصادفی است. حال می توان یک فرایند دیریکله را به اینصورت ایجاد کرد: یک توزیع تصادفی انتخاب می کنیم و بی نهایت متغیر تصادفی را در نظر بگیرید که بی نهایت مقدار تصادفی از آن را مشخص می کنند. می توان این فرایند را توسط سناریوهای دیگری نیز تصویر کرد؛ مانند فرایند رستوران چینی یا فرایند شکستن چوب.
راه دیگر برای تصور فرایند دیریکله تصور یک توزیع دیریکله بینهایت است. با میل دادن ابعاد یک توزیع دیریکله متقارن K بعدی با پارامتر تراکم α / K به بی نهایت، می توان به فرایند شکستن چوب رسید که تجسمی دیگر برای فرایند دیریکله است.
اولین بار فرایند دیریکله توسط توماس فرگوسن در سال ۱۹۷۳معرفی شده است. [ ۱] از آن پس در داده کاوی، یادگیری ماشین، پردازش زبان طبیعی، بینایی کامپیوتر و بیوانفورماتیک استفاده شده است.
توزیع مخلوط زیر را در نظر بگیرید:
مجموعه x 1 , … , x N داده های مشاهده هستند که مطابق توزیع مخلوط با K مؤلفه توزیع شده اند و هر مؤلفه دارای توزیع ثابت F ( θ ) است، بطوریکه هر مؤلفه دارای پارامتر متفاوتی برای θ است که به نوبهٔ خود از توزیع H بدست آمده است. معمولاً توزیع H ، مزدوج پیشین توزیع F است.
عکس فرایند دیریکله
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلف

پیشنهاد کاربران

بپرس