قانون زیف

دانشنامه عمومی

قانون زیف ( به انگلیسی: Zipf's law، /zɪf/ ) یکی از قوانین تجربی است. این قانون توسط آمار ریاضی فرمول بندی شده است، و به این واقعیت اشاره دارد که انواع مختلف داده ( که در علوم فیزیکی و اجتماعی مطالعه می شوند ) را می توان توسط «توزیع زیفی» تقریب زد. این قانون عضوی از خانواده توزیع احتمال قانون توانی است. توزیع زیف با توزیع زتا مرتبط می باشد، ولی باهم یکسان نیستند.
قانون زیف در اصل به صورت عبارات زبان شناسی کمی فرمول بندی شد، و بیان می کرد که: اگر به ما چندین پیکره متنی شامل متون زبان طبیعی داده شود، «فراوانی» هر واژه به صورت معکوس با «رتبه» آن در جدول فراوانی متناسب است.
بر اساس قانون زیف، فراوان ترین واژه تقریباً دوبرابر دومین واژه فراوان تر رخ می دهد و سه برابر سومین واژه فراوان تر رخ می دهد و غیره.
توزیع رتبه - فراوانی یک رابطه وارون را بیان می کند. برای مثال در پیکره متنی براون که شامل متون انگلیسی آمریکایی است، واژه "the" فراوان ترین کلمه است، و خودش به تنهایی ۷٪ از همه رخدادهای واژه ها را شامل می شود ( یعنی ۶۹٬۹۷۱ تکرار از بین تقریباً یک میلیون ) . در این پیکره، قانون زیف رعایت شده است، یعنی: دومین واژه پرفراوانی که "of" می باشد، شامل تقریباً ۳٫۵٪ کلمات است ( ۳۶٬۴۱۱ بار رخداد ) ، و پس از آن واژه "and" می باشد ( ۲۸٬۸۵۲ بار رخداد ) . در این پیکره متنی، فقط ۱۳۵ ورودی از دایره واژه ها، لازم است تا نیمی از پیکره براون را شامل شود. [ ۱]
این قانون به افتخار زبان شناس آمریکایی جورج کینگزلی زیف ( ۱۹۰۲ تا ۱۹۵۰ ) نامگذاری شده است، که آن را به محبوبیت رساند و تلاش کرد آن را توضیح بدهد ( زیف ۱۹۳۵ تا ۱۹۴۹ ) ، اما او هیچگاه ادعا نکرده بود که آن را اختراع کرده است. [ ۲] به نظر می رسد که تندنویس فرانسوی با نام ژان باتیست استوپ ( ۱۸۶۸ تا ۱۹۵۰ ) به این نظم، قبل از زیف اشاره کرده باشد. [ ۳] [ در متن مقاله تأیید نشده است] این قانون همچنین در سال ۱۹۱۳ توسط فیزیکدان آلمانی فلیکس آورباخ ( ۱۸۵۶ تا ۱۹۳۳ ) اشاره شده است. [ ۴]
قانون زیف از جمله قوانینی بود که در قرن بیستم مطرح شد و برای نخستین بار به مطالعهٔ مشخصه ها و فرایندهای مرتبط با مدارک می پرداخت. جورج کینگزلی زیف، استاد زبان شناسی دانشگاه هاروارد، در سال ۱۹۴۹ با آزمایش کلمات کتاب اولیس جیمز جویس به نتایجی در مورد کلمات و میزان تکرار آن ها در متن رسید. نتایج او به این صورت بود که: اگر تمام کلمات یک کتاب را بشماریم و از زیاد به کم مرتب کنبم به این نتیجه می رسیم که رتبهٔ هر کلمه با فراوانی ( بسامد ) همان کلمه نسبت عکس دارد، یعنی تعداد دفعاتی که هر کلمه در متن ظاهر می شود با رتبهٔ همان کلمه در متن رابطه معکوس دارد. این نسبت در کلمات کل متن برقرار است؛ که به قانون زیف معروف شده است. بر طبق زیف کلمه ای که در رتبهٔ ۱ قرار دارد دوبرابر بیشتر از کلمه ای در متن ظاهر می شود که در رتبهٔ ۲ قرار دارد و ۳ برابر بیشتر از کلمه ای ظاهر می شود که در رتبهٔ ۳ قرار دارد و همین طور تا آخر.
عکس قانون زیفعکس قانون زیف
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلف

پیشنهاد کاربران

بپرس