مکانیک آماری

مکانیک آماری، یکی از مباحث مطرح در فیزیک است که به سیستم‌هایی با تعداد متغیرهای بسیار زیاد می‌پردازد. این متغیرها می‌توانند ذراتی چون اتم‌ها، مولکول‌ها، یا ذرات بنیادی باشند که تعداد آن‌ها می‌تواند هم‌مرتبه با عدد آووگادرو باشد.





در این مبحث، با استفاده از خاصیتهای میکروسکوپی این ذرات مانند ساختار اتمی و برهمکنش بین آن‌ها، اطلاعاتی در مورد خواص ماکروسکوپی سیستم مانند فشار، انتروپی و انرژی آزاد گیبس، از طریق محاسبات و روش‌های آماری به دست می‌آید. مثلاً معادله‌های حالت در ترمودینامیک توسط مدل‌های میکروسکوپی-آماری مشتق می‌شوند.

مکانیک آماری شکوفایی خود را قبل از همه، مدیون دانشمندان کلاسیکی نظیر لودویگ بولتزمان، جوسایا ویلارد گیبز و جیمز کلرک ماکسول می‌باشد.





میانه‌ها و شاخص‌های آماری
میانه‌ها وشاخص‌های آماری ترتیبی

iامین شاخص آمار ترتیبی یک مجموعه n عضوی، iامین عضو کوچک است. به عنوان مثال، مینیمم یک مجموعه از اعضا، اولین شاخص آمار ترتیبی (i=۱)است و ماکزیمم، nامین شاخص آمار ترتیبی (i=n)است. میانه، به طور غیر رسمی، نقطهٔ میانی مجموعه‌است. هنگامی که n فرد است، میانه منحصر به فرد است که در i=(n+۱)/۲ رخ می‌دهد. وقتی n زوج است، دو میانه وجود دارند که در i=n/۲ و i=n/۲+۱ رخ می‌دهند. این مقاله انتخاب iامین شاخص آمار ترتیبی از یک مجموعه با n عضو مجزا را بیان می‌کند. مسئله انتخاب می‌تواند به طور رسمی به شکل زیر تعیین شود: ورودی: مجموعه A با n عدد(مجزا) و عدد i، که i بزرگتر یا مساوی ۱ و کوچکتر یا مساوی با n است. خروجی: عضو x در A که بزرگتر از دقیقا i-۱ عضو دیگر A می‌باشد. مسئله انتخاب می‌تواند در زمان (O(nlgn حل شود، چون می‌توانیم اعداد را با استفاده از مرتب سازی دودویی (heap sort) یا مرتب سازی ادغام مرتب کنیم و سپس به سادگی iامین عنصر در آرایه خروجی را مشخص کنیم اما الگوریتم‌های سریع تری وجود دارند. ابتدا مسئله انتخاب مینمم و ماکزیمم یک مجموعه از اعضا را بررسی می‌کنیم. مسئله جالب تر، مسئله انتخاب کلی است، که دردوقسمت بررسی می‌شود.قسمت اول یک الگوریتم عملی را تحلیل می‌کند که در حالت میانگین به زمان اجرای (O(n می‌رسد. قسمت بعد یک الگوریتم است که جنبه‌های نظری بیشتری داشته و در بدترین حالت به زمان اجرای (O(n می‌رسد.






مینیمم و ماکزیمم

چه تعداد مقایسه برای تعیین یک مجموعه n عضوی لازم است؟ می‌توانیم به سادگی به حد بالای n-۱ برای مقایسه‌ها برسیم: هر عضو مجموعه را به ترتیب بررسی کرده و کوچکترین عضوی که تا کنون دیده شده‌است را نگه می‌داریم. در روال زیر، فرض می‌کنیم مجموعه در آرایه A قرار دارد، که طول آرایه n است. قطعا یافتن ماکزیمم می‌تواند با n-۱ مقایسه نیز انجام شود. آیا این بهترین کاری است که می‌توانیم انجام دهیم؟ بله، چون می‌توانیم به حد پایین n-۱ برا مقایسه‌ها برای مینممم برسیم. الگوریتم را در نظر بگیرید که مینیمم را به صورت مسابقه‌ای بین عناصر تعیین می‌کند. هر مقایسه یک بازی در مسابقه‌است که در آن عنصر کوچکتر از میان دو عنصر، برنده می‌شود. نگرش اصلی این است که هر عنصر به جز برنده باید حداقل یک بازی را ببازد. از این رو n-۱ مقایسه برای تعیین مینیمم لازم است.






مینیمم و ماکزیمم هم زمان

در برخی کاربردها، باید هم مینیمم و هم ماکزیمم یک مجموعه از n عضو را پیدا کنیم. ارائه الگوریتمی که بتواند هم مینیمم و هم ماکزیمم n عضو را با استفاده از (θ(nمقایسه، که به طور مجانبی بهینه‌است، پیدا کند سخت نیست. به سادگی مینیمم و ماکزیمم را به طور مستقل، با استفاده از n-۱ مقایسه برای هر یک پیدا می‌کند، که در کل ۲n-۲ مقایسه انجام می‌دهد. در حقیقت، حداکثر ۳n/۲ مقایسه برای پیدا کردن مینیمم و ماکزیمم کافی است. استراتژی این است که اعضای مینیمم و ماکزیمم را که تا این جا دیده شده‌اند نگه داریم. به جای این که هر عضو ورودی را با مقایسه با مینیمم و ماکزیمم فعلی پردازش کنیم، که هزینه ۲ مقایسه برای هر عضو را صرف می‌کند، اعضا را جفت به جفت مقایسه می‌کنیم. ابتدا جفت عضوها را از ورودی با یکدیگر مقایسه می‌کنیم و سپس عضو کوچکتر را با مینیمم جاری و عضو بزرگتر را با ماکزیمم جاری مقایسه می‌کنیم که هزینه ۳ مقایسه برای هر دو عضو را موجب می‌شود.






انتخاب در زمان خطی مورد انتظار

مسئله انتخاب کلی نسبت به مسئله پیدا کردن یک مینیمم سخت تر به نظر می‌آیدو هم چنان که به صورت شگفت آوری زمان اجرای مجانبی هر دو مسئله یکی است: (θ(n.در این بخش یک الگوریتم تقسیم و حل را برای مسئله انتخاب ارائه می دهیم. الگوریتم Randomized-Select بعد از الگوریتم مرتب سازی سریع مدل می‌شود. همانند مرتب سازی سریع ایده آن است که آرایه ورودی را به طور بازگشتی تقسیم کنیم. ولی برخلاف مرتب سازی سریع که هر دو طرف تقسیم بندی را به صورت بازگشتی پردازش می‌کند، Randomized-Select فقط روی یک طرف تقسیم بندی عمل می‌کند. این تفاوت در تحلیل آشکار می‌شود. در حالی که زمان اجرای مورد انتظار مرتب سازی سریع (θ(nlgn است، زمان مورد انتظار این الگوریتم (θ(nاست. Randomized-Select از روال Randomized-Partition که در بخش مرتب سازی سریع معرفی شد استفاده می‌کند.






انتخاب در بدترین حالت زمان خطی

اکنون الگوریتمی را بررسی می کنیم که زمان اجرای آن در بدترین حالت (O(nاست. مانند Randomized-Select، الگوریتم Select عنصر مورد نظر را با تقسیم بندی بازگشتی آرایه ورودی پیدا می‌کند. اما ایده‌ای که پشت این الگوریتم وجود دارد، این است که یک قسمت خوب را در هنگامی که آرایه تقسیم می‌شود تضمین می‌کند. Select از الگوریتم تقسیم بندی قطعی Partition مربوط به مرتب سازی سریع استفاده می‌کند که طوری تغییر یافته است که عنصری که تقسیم بندی حول آن انجام می‌شود را به عنوان پارامتر ورودی بگیرد. این الگوریتم iامین عنصر کوچک از آرایه ورودی با n>1 عنصر را با اجرای مراحل زیر تعیین می‌کند.(اگر n=1باشد آن گاه Select به طور مطلق، تنها ورودیش را به عنوان iامین عنصر کوچک برمی گرداند.)

n عنصرآرایه ورودی را بهn/5 گروه 5 عنصری تقسیم کنید و حداکثر یک گروه از n mod 5 عنصر باقیمانده ساخته می‌شود.
میانه هر یک از n/5گروه را ابتدا با مرتب ساز درجی عناصر هر گروه (که حداکثر 5 عنصر در هر یک وجود دارد)و سپس انتخاب میانه از لیست مرتب شده عناصر گروه پیدا کنید.
از Select به صورت بازگشتی برای پیدا کردن میانه x از n/5میانه‌ای که در مرحله 2 پیدا شدند استفاده کنید.
آرایه ورودی را حول میانهٔ میانه‌ها (یعنی x)با استفاده از نسخه تغییر یافته Partition تقسیم کنید. فرض کنید k یک واحد بیشتر از تعداد عناصر در طرف کم تر تقسیم بندی باشد، بنابراین k، x امین عنصر کوچک است و n-k عنصر در طرف بیشتر تقسیم بندی موجود است.
اگر i=k باشد، x را برگردانید در غیر این صورت اگر i<k باشد از Select به صورت بازگشتی برای پیدا کردن iامین عنصر کوچک در طرف کم تر استفاده کرده یا اگر i>k باشد، از آن برای پیدا کردن (i-k)امین عنصر کوچک در طرف بیشتر استفاده کنید.

برای تحلیل زمان اجرای Select، ابتدا یک حد پایین روی تعداد عناصر بزرگتر از عنصر تقسیم کنندهٔ x تعیین می کنیم. حداقل نصفی از میانه‌های پیدا شده در مرحله 2 بزرگتر از x یعنی میانهٔ میانه‌ها هستند. بنابراین در حداقل نصف n/5گروه، 3 عنصر وجود دارند که از x بزرگترند، به جز برای گروهی که اگر5 به n قابل قسمت نباشد، کم تر از 5 عنصر دارد و گروهی که خود شامل x است. با منظور نکردن این دو گروه ثابت می‌شود که تعداد عناصر بزرگتر از x حداقل برابر است با

3(2-1/2n/5)

که این عبارت بزرگتر یا مساوی با 3n/10-6 است. به طور مشابه عناصری که کوچک تر از x هستند حداقل 3n/10-6 است. بنابراین در بدترین حالت، Select برای حداکثر 7n/10+6 عنصر در مرحلهٔ 5 به طور بازگشتی فراخوانی می‌شود.





توان آماری

توان یک آزمون آماری احتمال رد کردن فرض صفر اشتباه می‌باشد (احتمال آنکه تست آماری مرتکب خطای نوع دوم نشود). هر چه توان یک تست بیشتر باشد احتمال وقوع خطای نوع دوم کمتر خواهد بود.

محققان همیشه نگران این بوده اند که نکند فرضیه صفر را رد کنند در حالی که در واقع درست بوده است (تست آماری مرتکب خطای نوع یک شود) یا اینکه نتوانند فرضیه صفر را رد کنند در حالی که این روش های استفاده شده بوده اند که اثری واقعی داشته‌اند (تست آماری مرتکب خطای نوع دو شود). توان آماری یک تست، احتمال آن است که منجر به این میشود که شما فرضیه صفر را رد کنید وقتی فرضیه در واقع غلط است. چون بیشتر تست های امری در شرایطی انجام میشوند که عامل اصلی(treatment)، حداقل کمی اثر روی نتیجه دارد، توان آماری به صورت احتمال اینکه آن تست "منجر به نتیجه گیری درستی در مورد فرضیه صفر میشود"، تعبیر میشود.

توان یک تست آماری عبارت است از: یک، منهای احتمال ایجاد خطای نوع دو. یا به عبارتی، احتمال اینکه شما از خطای نوع دو دوری میکنید.

در مطالعات با توان آماری بالا، خیلی کم پیش میاید که در تشخیص اثرات تمرین اشتباه کنند.

توان یک تست آماری، شامل عملکردِ: حساسیت، اندازه اثر در جمیعت آماری، و استاندارد های استفاده شده برای اندازه گیری فرضیه آماری است. - ساده ترین راه برای افزایش حساسیت یک تحقیق، افزایش تعداد آزمودنی هاست. - در مورد استاندارد، ساده تر آن است که فرضیه صفر را رد کنیم اگر سطح معناداری، ۰.۰۵ باشد تا ۰.۰۱ یا ۰.۰۰۱.

سه قدم برای تعین توان آماری: ۱- مشخص کردن حد، برای معنی دار بودن آماری. فرضیه چیست؟ سطح معناداری چقدر است؟

۲- حدس زدن اندازه اثر. انتظار دارد که درمان(treatment)، دارای اثری کم، زیاد، یا متوسط باشد؟





احتمالات

بطور ساده، احتمالات (به انگلیسی: Probability) به شانس وقوع یک حادثه گفته می‌شود.

احتمال معمولا مورد استفاده برای توصیف نگرش ذهن نسبت به گزاره هایی است که ما از حقیقت انها مطمئن نیستیم. گزاره های مورد نظر معمولا از فرم "آیا یک رویداد خاص رخ می دهد؟" و نگرش ذهن ما از فرم "چقدر اطمینان داریم که این رویداد رخ خواهد داد؟" است. میزان اطمینان ما، قابل توصیف به صورت عددی می باشد که این عدد مقداری بین 0 و 1 را گرفته و آن را احتمال می نا میم. هر چه احتمال یک رویداد بیشتر باشد، ما مطمئن تر خواهیم بود که آن رویداد رخ خواهد داد. درواقع میزان اطمینان ما از اینکه یک واقعه (تصادفی) اتفاق خواهد افتاد.






نظریهٔ احتمالات

نظریهٔ احتمالات به شاخه‌ای از ریاضیات گویند که با تحلیل وقایع تصادفی سروکار دارد.

مانند دیگر نظریه ها، نظریه احتمال نمایشی از مفاهیم احتمال به صورت شرایط صوری (فرمولی) است – شرایطی که می‌تواند به طور جدا از معنای خود در نظر گرفته شود. این فرمولبندی صوری توسط قوانین ریاضی و منطق دستکاری، ونتیجه های حاصله، تفسیر و یا دوباره به دامنه مسئله ترجمه می شوند.

حداقل دو تلاش موفق برای به بصورت فرمول دراوردن احتمال وجود دار : فرمولاسیون کولموگروف و فرمولاسیون کاکس. در فرمولاسیون کولموگروف (نگاه کنیدبه )، مجموعه ها به عنوان واقعه و احتمالات را به عنوان میزانی روی یک سری از مجموعه ها تفسیرمی کنند. در نظریه کاکس، احتمال به عنوان یک اصل (که هست، بدون تجزیه و تحلیل بیشتر) و تاکید بر روی ساخت یک انتساب سازگار از مقادیر احتمال برای گزاره ها است. در هر دو مورد، قوانین احتمال یکی هستند مگر برای جزئیات تکنیکی مربوط به آنها.

روشهای دیگری نیز برای کمی کردن میزان عدم قطعیت، مانند نظریه Dempster-Shafer theory یا possibility theory وجود دارد ، اما آن ها به طور اساسی با آنچه گفته شد، تفاوت دارند و با درک معمول از قوانین احتمال سازگار نیستند.






تاریخچه

مطالعه علمی احتمال، توسعه ای مدرن است. قمارنشان می دهد که علاقه به ایده های تعیین کمیت برای احتمالات به هزاران سال می رسد، اما توصیفات دقیق ریاضی خیلی دیرتر به وجود آمد. دلایلی البته وجود دارد که توسعه ریاضیات احتمالات را کند می کند. در حالی که بازی های شانس انگیزه ای برای مطالعه ریاضی احتمال بودند، اما مسائل اساسی هنوز هم تحت تاثیر خرافات قماربازان پوشیده می شود.

به گفته ریچارد جفری، "قبل از اواسط قرن هفدهم، اصطلاح ‘’ احتمالی’’ به معنای قابل تایید (تصویب) و در آن معنا چه برای عقیده افراد و چه برای عمل مورد استفاده بود. در واقع افکار یا اقدام احتمالی، رفتاری بود که مردم معقول درآن شرایط از خود نشان می دادند." البته به خصوص در زمینه های قانونی ،احتمالی (به انگلیسی: Probability) همچنین می تواند به گزاره ای که شواهد خوبی برای اثبات آن وجود دارد، اطلاق شود.

گذشته از کار ابتدایی توسط Girolamo Cardano در قرن 16 اصول احتمالات به مکاتبات پیر دو فرما و بلز پاسکال (1654). کریستین هویگنس (1657) اولین مدل شناخته شده علمی از این موضوع را داد. یاکوب برنولی ARS Conjectandi (منتشرشده پس ازمرگ،1713) و اصول شانس Abraham de Moivre (1718) این موضوع را به عنوان شاخه ای از ریاضیات مطرح می کند. برای تاریخچه ای از توسعه های اولیه مفهوم احتمال ریاضی، ظهور احتمال هک ایان و علم حدس جیمز فرانکلین را ببینید.

تئوری خطاها ممکن است از Roger Cotes's Opera Miscellanea (منتشرشده پس ازمرگ،1722) سرچشمه گرفته باشد، اما شرح حالی که توماس سیمپسون در سال 1755 آماده کرد(چاپ 1756)، برای اولین بار اعمال این نظریه به بحث در مورد خطاهای مشاهده است. چاپ مجدد (1757) این شرح حال نشان می دهد که خطاهای مثبت و منفی هر دو به یک اندازه قابل پیشبینی هستند، و با اختصاص برخی از محدودیت های معین، بازه ای برای تمام خطاها ارائه می دهد.سیمپسون همچنین در مورد خطاهای پیوسته بحث می کند و یک منحنی احتمال را توصیف می کند.

پیر سیمون لاپلاس(1774) برای اولین بار سعی دراستنتاج قانونی برای توصیف مشاهدات از نظر اصول تئوری احتمالات کرد. او قانون احتمال خطاها را با یک منحنی به صورت y = \phi(x), x ، x هر نوع خطا و y احتمال آن معرفی می کند و 3 خاصیت برای این منحنی وضع می کند:

نسبت به محور y متقارن است
محور x مجانب است، احتمال خطا در \infty صفر است
مساحت زیر نمودار آن برابر 1 است.

او همچنین، در سال 1781، یک فرمول برای قانون امکان خطا ( اصطلاحی که لاگرانژ سال 1774 مورد استفاده قرار داد) ارائه کرد، اما به معادلات منظمی منجر نشد.

به طور کلی پیدایش فنون و مفاهیم مربوط به احتمالات را باید به آغاز مدل‌سازی ریاضی و استخراج و اکتشاف دانش در زمینه‌های پیچیده تر علوم نسبت داد.






تفسیرها و تحلیل‌های مفاهیم احتمالات

کلمه احتمال تعریف مفرد مستقیم برای کاربرد عملی ندارد. در واقع، چندین دسته گسترده از تفسیر احتمال، که پیروان دارای دیدگاه های مختلف (و گاهی متضاد) در مورد ماهیت اساسی احتمال وجود دارد.

Frequentists
Subjectivists
Bayesians







کاربردها

نظریه احتمال در زندگی روزمره در ارزیابی ریسک و در تجارت در بازار کالاها اعمال می شود. دولت ها به طور معمول روش های احتمالاتی را در تنظیم محیط زیست اعمال می کنند، که آن را تجزیه و تحلیل مسیر می نامند. یک مثال خوب اثر احتمال هر گونه درگیری گسترده در خاورمیانه بر قیمت نفت است، که اثرات موج واری روی اقتصاد کل جهان می گذارد. ارزیابی که توسط یک معامله گر کالا زمانیکه احتمال جنگ بیشترباشد، در مقابل حالتی که احتمال کمتری دارد، قیمت ها را بالا و پایین می فرستد و معامله گران دیگر را نیز از نظرات خود آگاه می کند. در واقع، احتمالات (در تجارت) به طور مستقل ارزیابی نمی شوند و لزوما عقلانی نیستند. تئوری های رفتار مالی برای توصیف اثر فکر گروهی در قیمت گذاری ، در سیاست، و در صلح و درگیری ظهور کردند.

می توان گفت که کشف روش های جدی برای سنجش و ترکیب ارزیابی های احتمال، عمیقا جامعه مدرن را تحت تاثیر قرار داده است. مثلا اکثر شهروندان اهمیت بیشتری به اینکه چگونه ارزیابی های احتمال وشانس ساخته می شوند، می دهند واینکه تاثیر آنها در تصمیم گیری ها بزرگتر و به ویژه در دموکراسی چگونه است.

یکی دیگر از کاربردهای قابل توجه نظریه احتمال در زندگی روزمره، قابلیت اطمینان می باشد. بسیاری از محصولات مصرفی، از جمله خودروها و لوازم الکترونیکی مصرفی، در طراحی خود به منظور کاهش احتمال خرابی(شکست) از نظریه قابلیت اطمینان استفاده می کنند. تولید کننده با توجه به احتمال خرابی یک محصول، آنرا گارانتی می کند.






علوم اجتماعی

نقش پایه و اساس را برای بیشتر علوم اجتماعی داراست. آزمونهای آماری فواصل اطمینان شیوه‌های رگرسیون (پس رفت)





توزیع احتمال
در نظریه احتمال و آمار تابع توزیع احتمال بیانگر احتمال هر یک از مقادیر متغیر تصادفی (در مورد متغیر گسسته) و یا احتمال قرار گرفتن متغیر در یک بازه مشخص (در مورد متغیر تصادفی پیوسته) میباشد. توزیع تجمعی احتمال یک متغیر تصادفی تابعی است از دامنهٔ آن متغیر بر بازهٔ 0,1. به طوری که احتمال رخدادن پیشامدهای با مقدار عددی کمتر از آن را نمایش می‌دهد.





روش‌های آمارگیری
در آمار کاربردی، روش‌های آمارگیری روش‌هایی برای نمونه‌برداری از یک جامعه آماری هستند که به منظور بهبود میزان پاسخ و دقت پاسخ به آمارگیری تدوین می‌شوند. سنجه‌های اندازه‌گیری شده آماره نام دارند که به منظور استنباط آماری در مورد کل جامعه طراحی می‌شوند. گه‌گاه آماره‌هایی توصیفی نیز گردآوری می‌شوند. نظرسنجی‌ها، پرسشنامه‌ها، و سرشماری‌ها در مورد وضعیت سلامت یا بازار مثال‌هایی از آمارگیری هستند. آمارگیری ابزار مهمی برای تحقیق در مورد جنبه‌های مختلف جامعه است و اطلاعات مهمی را در اختیار می‌گذارد؛ از جمله زمینه‌هایی که آمارگیری در آن کاربر دارد به بازاریابی، روانشناسی، سلامت عمومی، و جامعه‌شناسی اشاره کرد.





داده

به طور کلی، می‌توان همهٔ دانسته‌ها، آگاهی‌ها، داشته‌ها، آمارها، شناسه‌ها، پیشینه‌ها و پنداشته‌ها را داده یا دیتا (به انگلیسی: Data) نامید. انسان برای ثبت و درک مشترک هر واقعیت و پدیده از نشانه‌های ویژهٔ آن بهره گرفته‌است.

انسان برای نمایاندن داده‌ها نخست از نگاره و در ادامهٔ سیر تکاملی آن از حروف، شماره‌ها و نشانه‌ها کمک گرفت. برای بازنمودن داده‌ها از این موارد کمکی یا ترکیبی از آن‌ها استفاده می‌شود
در رایانه

به اعداد، حروف و علائم که جهت درک و فهم مشترک از انسان‌ها یا رایانه سرچشمه می‌گیرند داده می‌گویند. داده‌ها معمولاً از سوی انسان‌ها بصورت حروف، اعداد، علائم و در رایانه به صورت نمادهایی (همان رمزهای صفر و یک) قراردادی ارائه می‌شوند. اصطلاح داده یک عبارت نسبی است یعنی اگر موجب درک و فهم لازم و کامل دراین مرحله شده‌است به عنوان آگاهی یا اطلاعات از آن نام می‌برند و چنانچه موجب درک و فهم کامل نگردد به عنوان همان داده به شمار می‌آیند و چون هدف نهایی آگاهی و اطلاعات است باید از سوی دست‌اندرکاران (انسان یا رایانه) دستکاری یا پردازش شوند. منظور از دستکاری یا پردازش داده‌ها انجام عملیاتی از قبیل جمع، تفریق، ضرب، تقسیم، مقایسه وغیره‌است.

داده‌ها مجموعه‌ای از نمادها (برای انسان حروف، اعداد، علائم و برای رایانه رمزهای صفر و یک) هستند که حقایق را نشان می‌دهند و برای انسان از طریق رسانه‌های وی (بینایی، شنوایی، چشایی، بویایی، بساوایی) و برای رایانه از طریق لوازم ویژه (صفحه کلید موس و غیره) به دست می‌آیند.

داده‌ها امروزه فقط از سوی انسان یا رایانه پردازش می‌شوند یعنی کارهایی روی آن‌ها صورت می‌گیرد. در پردازش داده‌ها (داده‌پردازی) در رایانه ابتدا داده‌ها به رایانه وارد می‌شوند. این داده‌ها درابتدا ذخیره شده و روی آن‌ها عملیاتی (جمع، تفریق، ضرب، تقسیم و...) صورت می‌گیرد. پس از این که این عملیات (پردازش) صورت گرفت معمولاً داده‌ها به یک رایانه دیگر یا دوباره به انسان‌ها منتقل می‌شود. در اغلب گزارش‌ها و یادداشت‌های سازمانی، داده‌ها به چشم می‌خورند. برای نمونه، تاریخ و مقدار یک صورت‌حساب یا چک، جزئیات فهرست حقوق، تعداد وسایل نقلیه‌ای که از نقطهٔ خاصی در کنار جاده گذشته‌اند،... نمونه‌هایی از داده‌ها هستند.
انواع داده‌ها از نظر ساخت‌یافتگی

داده‌های ساخت‌یافته
داده‌های نیمه‌ساخت‌یافته







داده‌های زمانی
در بسیاری از کاربردهای مبتنی بر داده‌ها و اطلاعات ذخیره‌سازی و بازیافت حالا ت و وضعیت‌های سیستم در طی زمان اهمیت می‌یابد.





قضاوت

قضاوت در بافت حقوقی ، به معنی کشف حقیقت در نزاع چند طرف که در نهایت به ارائه حکمی از سوی نهاد متصدی قضاوت و لازم الاجراء از سوی حکومت برای پایان دادن به اختلاف میان آنها منجر می شود .





بیانیه
بیانیه متنی است که یک شخص یا گروه از آن برای بیان اصول، عقاید و اهداف خود به عموم استفاده می‌کند. رسمیت بیانیه‌ها، با توجه به بیان‌کنندهٔ آن‌ها و مطالب بیان‌شده، به دو دستهٔ رسمی و غیررسمی طبقه‌بندی می‌گردد.





استدلال

استدلال، ترکیب قانون‌مند قضیه(های) معلوم برای رسیدن به قضیه(های) تازه است. در استدلال، ذهن بین چند قضیه، ارتباط برقرار می‌کند تا از پیوند آن‌ها، نتیجه زاده شود و به‌این‌ترتیب نسبتی مشکوک و مبهم به نسبتی یقینی تبدیل شود.






انواع استدلال

تمثیل

تمثیل سرایت دادن حکم یک موضوع به موضوع دیگر به دلیل مشابهت آن دو به یکدیگر است.







استقرا

استقرا نوعی استدلال است که در آن ذهن از جزء به کل سیر می‌کند. یعنی چند مورد جزئی را مشاهده می‌کند و سپس یک حکم کلی می‌دهد. مثلا در چند مورد آب را حرارت می‌دهیم و می‌بینیم که در صد درجه سلسیوس می‌جوشد و از این نتیجه می‌گیریم که هر آبی در صد درجه سلسیوس می‌جوشد.







قیاس (استنتاج)

اما وقتی ذهن از قضیه‌های کلّی به نتیجه‌های جزئی می‌رسد و به عبارت مختصرتر از کلّ به جز می‌آید، آن را قیاس می‌نامند. مثال:

«۱. سقراط انسان است.

۲. هر انسان فانی است.

۳. پس سقراط فانی است.»

در استدلال قیاسی از حداقل دو قضیهٔ درست، ضرورتا و بدون هیچ تردیدی قضیهٔ درست دیگری به نام نتیجه به دست می‌آید.





حقیقت
حقیقت مفهوم و اصطلاحی است برای اشاره به اصل هر چیز استفاده می‌شود.






واژه‌شناسی

واژه حقیقت وام‌واژه‌ای است که از واژه عربی حقیقة وارد فارسی شده‌است. معادل انگلیسی واژه حقیقت واژهٔ Truth می‌باشد.






تفاوت حقیقت و واقعیت

حقیقت شامل ذات هر چیزی بوده و غیر قابل تغییر است و به همین دلیل بر خلاف واقعیت امری است که لزوماً با برهان‌های علمی قابل اثبات نیست. در بسیاری موارد حقیقت ( به دلیل اینکه از دسترس انسان به حیطه ذات به دور است )به نوع نگرش افراد بستگی پیدا میکند. بطور مثال واقعیت و حقیقت واقعه کربلا را می‌توان به این دو صورت بیان کرد.

واقعیت: حسین و یارانش به سمت کوفه حرکت کردند، لشکریان یزید در محلی به نام کربلا بر آنها حمله کردند، و حسین کشته شد. و یزید پیروز این جنگ بود.

اما حقیقت می‌تواند این باشد:

در واقعه کربلا امام حسین و یاران با وفایش برای نجات دین اسلام تصمیم به هجرت به کوفه گرفتند. اما لشکریان یزید ملعون به آنان حمله کردند و در این واقعه امام حسین به شهادت رسید. و امام حسین توانست با نثار خون خود اسلام را زنده نگاه دارد و به حق او پیروز این میدان بود.


اگر در ریشهٔ واژگان حقیقت و واقعیت دقیق شویم، تفاوت‌هایی را مشاهده می‌کنیم. ریشهٔ کلمهٔ حقیقت، "حق" به معنای راستی و درستی است و ریشهٔ کلمهٔ واقعیت، "وَقَعَ" به معنای رویدادن و یا اتفاق افتادن است. حقیقت، اشاره به ماهیت راست و درست دارد و واقعیت اشاره به امور عینی و یا اموری که اتفاق می‌افتند.

یک نگرش افراطی حقیقت یک واقعه تاریخی را جز بیان عواطف و احساسات گوینده در رابطه با آن واقعه نمی‌داند و هدف آن جذب باور به حقیقت گفته شده است.






حقیقت و واقعیت در اندیشه‌های متفکران و فلاسفه

در یونان باستان، نوعی تفکر اسطوره‌ای نسبت به مقولهٔ حقیقت و واقعیت وجود داشته که طی سیر تحول به مذهب و باورهای مذهبی تبدیل شده است. این مساله در هر تمدن دیگری نیز مشاهده می‌شود. تمدن‌های بین‌النهرین، هند و چین همگی چنین سیر تحولی را طی کرده‌اند.

تفکر اسطوره‌ای، طی تکاملش به صورت مثالی افلاطونی رسید که گونه‌ای تفکر مذهبی است. در اندیشه‌های مذهبی مانند سه مذهب زرتشتیت، مسیحیت و اسلام تمایز و جدایی واقعیت مادی و حقیقت وجود دارد.

دیدگاه عرفاً پیرامون حقیقت و واقعیت، شکل متکامل تفکرات دینی است.

آراء و اندیشه‌های متفکرین دوران مدرن و همچنین تحولاتی که در نوع نگاه انسان‌ها در جامعهٔ مدرن نسبت به حقیقت حاصل شده، باعث شده است تا مسیر گسست از اندیشه‌های اسطوره‌ای به اندیشه‌های دینی در دوران مدرن دچار واگشت و یا تغییر مسیر شود. یعنی تمایز و گسست حقیقت و واقعیت دوباره به اتحاد آن دو منجر شده است. در اصل، ظهور رئالیسم جدید و همچنین اومانیسم مدرن، نمایانگر گونه‌ای بازگشت به اصول کلاسیک یونانیان است. بشر در دوران مدرن اعتقاد یافت که طی سالیان درازی، دچار خطا شده است، از این رو دوباره به تفکر یونانی رجعت کرد.

در اندیشه‌های ماتریالیست‌ها و مارکسیست‌ها از جمله فوئرباخ، مارکس و انگلس و پیروان آن‌ها، ماده‌گرایی که خود یکی از ثمرات مدرنیته است، نمایشگر رجعت انسان به یکی انگاشتن حقیقت و واقعیت است. با این تفاوت که از نگاه ماتریالیست‌ها، حقایق، قوانینی هستند که بر واقعیات حاکم‌اند. به طور مثال، نیروی محرکهٔ تاریخ که بر وقایع تاریخی احاطه دارد، حقیقتی دربارهٔ جهان و هستی است.

اندیشه‌های فردریش ویلهلم نیچه، فیلسوف نامدار آلمانی دربارهٔ حقیقت از اهمیت بسیار بالایی برخوردار است. چون او، نوع نگاه انسان به حقیقت را دگرگون کرد و با وهمی خواندن حقیقت، به تبیین یک نگاه کاملاً نسبی‌گرایانه پرداخت. نسبیت حقیقت که با نیچه آغاز شد در نهایت به مکاتب و تفکراتی از جمله هرمنوتیک، مکتب فرانکفورت و پست‌مدرنیسم منجر شد.

اندیشه‌های نسبی‌گرایانهٔ نیچه در باب حقیقت و واقعیت به شکلی رادیکال در آراء متفکران پست مدرنی چون ژان فرانسوا لیوتار، ژاک دریدا، ژیل دلوز، میشل فوکو و ژان بودریار دوباره مطرح شد.
1:07 am
کاربرد الگوریتم‌ها

در دنیای امروز مسائل فراوانی وجود دارد که می‌توان توسط الگوریتم‌ها راه حل‌های مناسب و بهینه‌ای برای آنها ارائه نمود. استفاده از الگوریتم‌ها در این مسائل باعث صرفه جویی در وقت و هزینه شده و راهکارهای نوینی را پیش رو قرار می‌دهد. از جمله:






- پزشکی و ژنتیک:

یکی از کاربردهای مهم الگوریتم‌ها در ژنتیک و در پروژه ژن‌های انسانی است. هدف پروژه ژن انسان، شناسایی تمام ۱۰۰۰۰۰ ژن در DNA انسان، تعیین دنباله‌ای از ۳ بیلیون جفت پایه شیمیایی DNA انسان، ذخیره این اطلاعات در پایگاه داده‌ها و تولید ابزارهایی برای تحلیل داده‌ها است که هر یک از این مراحل نیازمند الگوریتم‌هایی حرفه‌ای است و این خود تصدیقی بر اهمیت الگوریتم‌ها در پیشرفتهای پزشکی و ژنتیکی است. -

-اینترنت:

کاربرد دومی که برای الگوریتم‌ها ذکر می‌کنیم در اینترنت است. اینترنت موجب می‌شود افراد در سراسر جهان به سرعت به حجم زیادی از اطلاعات دستیابی داشته باشند و این مهم تحقق نمی‌یابد مگر به مدد الگوریتم‌های هوشمندی که برای مدیریت و دست کاری این اطلاعات استفاده می‌شود. مصداقهایی از کاربرد الگوریتم‌ها در فضای اینترنت شامل یافتن مسیرهای خوب برای ارسال داده‌ها و استفاده از موتورهای جستجو برای یافتن سریع صفحاتی است که اطلاعات مورد نظر در آن قرار دارد.

- تجارت الکترونیک:

کاربرد سوم الگوریتم‌ها در تجارت الکترونیک است. تجارت الکترونیک موجب می‌شود کالا‌ها و سرویس‌ها بطور الکترونیکی مذاکره و مبادله شوند. برای تحقق این امر توانایی نگهداری اطلاعاتی مانند شماره کارت اعتباری، کلمه‌های عبور و صورت حساب‌های خصوصی بانک‌ها ضروری است به همین دلیل از فناوری‌هایی نظیر رمز نگاری کلید عمومی و امضاهای دیجیتال برای نگهداری موارد ذکر شده استفاده می‌شوند که همگی مبتنی بر الگوریتم‌ها و تئوری اعداد هستند و این کارایی الگوریتم را در این حوزه نشان می‌دهد.

- صنعت:

چهارمین موردی که می‌توان برای کارایی الگوریتم‌ها ذکر کرد، در صنعت و تجارت است. در صنعت و تجارت لازم است منابع نادر با سودمند ترین روش تخصیص یابند بطوری که با منابع محدود بتوان به سود ماکزیمم و هزینه مینیمم رسید. برای دستیابی به این اهداف و حل مسئله‌هایی از این دست الگوریتمی نظیر الگوریتم برنامه ریزی خطی کارایی دارد که نتیجه بهینه را حاصل می‌کند.

- مسیر یابی:

کاربرد پنجم الگوریتم‌ها در مسیر یابی بالاخص یافتن کوتاهترین مسیرهای موجوداست. اگر هدف ما تعیین کوتاه ترین مسیر از یک تقاطع به دیگری در یک نقشه جاده‌ای باشد در حالی که تعداد مسیر‌های ممکن زیاد است، برای رسیدن به راه حل بهینه باید از الگوریتم‌های مسیریابی استفاده بنماییم. چنین مسئله‌ای را اگر بصورت گراف مدل سازی کنیم می‌توانیم به کمک الگوریتم‌های متعدد مسیر یابی مانند پریم، دایکسترا، فلوید و... بسته به خواسته‌های مسئله و نوع گراف کوتاه ترین مسیر را از یک راس به راس دیگر گراف پیدا نموده و بدین ترتیب مسئله را حل کنیم.

- مرتب سازی:

ششمین کاربردی که برای الگوریتم‌ها ذکر می‌کنیم در مرتب سازی است. برای مثال در طراحی‌های مکانیکی که بر حسب کتابخانه‌ای از قطعات داده شده‌اند و هر قطعه ممکن است شامل نمونه‌هایی از قطعات دیگر باشد اگر بخواهیم قطعات را به ترتیب لیست کنیم بطوری که هر قطعه قبل از قطعه‌ای که از آن استفاده می‌کنند، قرار گیرد بایدازالگوریتم‌های مرتب سازی مانند مرتب سازی موضعی استفاده کنیم. البته کاربرد الگوریتم‌ها در مرتب سازی و مدل‌های آن تنها محدود به این مثال و این مدل نمی‌شود بلکه الگوریتم‌های مرتب سازی مدل‌های فراوانی دارند از جمله مرتب سازی ادغامی، مرتب سازی درجی، مرتب سازی انتخابی و... که هر کدام کاربردهای جداگانه و متنوعی مختص خود دارند.

علاوه بر کاربردهای ذکر شده، کاربردهای دیگری نیز برای الگوریتم‌ها در ریاضیات و سایر زمینه‌های علمی وجود دارد مانند یافتن طویل ترین زیر دنباله مشترک، یافتن پوش محدب نقاط، انتخاب بهینه فعالیت‌ها و بسیاری نمونه‌های دیگر.





الگوریتم انتخاب
در علوم کامپیوتر، یک الگوریتم انتخاب، یک الگوریتم برای پیدا کردن kامین کوچک‌ترین عدد در یک لیست است (به چنین عددی kامین مرتبه آماری گفته می‌شود). این الگوریتم‌ها شامل پیدا کردن کمینه، بیشینه و میانه‌ی عناصر است. الگوریتم‌های انتخاب از O(n)، که در بدترین حالت خطی اند، وجود دارند. انتخاب یکی از زیرمسئله‌های مسائل پیچیده‌تر مانند مسئله نزدیک‌ترین همسایه و مسئله یافتن کوتاهترین مسیر است.




انتخاب با مرتب‌سازی
انتخاب ممکن است با مرتب کردن لیست و سپس استخراج عنصر دلخواه، به مرتب سازی تبدیل شود. این روش زمانی کارآمد است که به تعداد زیادی انتخاب از یک لیست نیاز باشد، در موردی که تنها یک بار مقداردهی می‌شود، یک مرتب سازی پرهزینه، همراه با چندین عمل استخراج کم‌هزینه انجام می شود. در حالت کلی، این روش نیازمند زمان O(n log n) است، که در آن n طول لیست است.



الگوریتم‌های کمینه/بیشینه خطی
الگوریتم‌های خطی، از لحاظ زمانی، برای پیدا کردن کمینه‌ها یا بیشینه‌ها این گونه کار می‌کنند که روی لیست تکرار می‌کنند و رد کمینه یا بیشینه تا هر بار نگه می‌دارند.



الگوریتم کلی انتخاب غیر خطی
با کمک ایده‌های مورد استفاده در الگوریتم‌های کمینه/بیشینه، ما می‌توانیم یک الگوریتم کلی ساده، ولی ناکارامد برای پیدا کردن کوچک‌ترین kامین یا بزرگ‌ترین k عنصر در یک لیست بدهیم، که نیاز به زمان O(k) دارد، که وقتی k کوچک باشد مؤثر است. برای انجام دادن آن، ما به سادگی کوچک‌ترین/بزرگ‌ترین مقدار را می‌یابیم و آن را به ابتدای بازه حرکت می‌دهیم تا به اندیس دلخواه برسیم. این کار را می‌توانیم به عنوان یک مرتب سازی انتخابی ناتمام ببینیم.





الگوریتم کلی انتخاب به صورت خطی - الگوریتم میانه‌ی میانه‌ها

یک الگوریتم با بدترین زمان اجرای خطی برای حالت کلی انتخاب kامین بزرگ‌ترین عنصر توسط بلوم، فلوید، پرت، ریوست و ترجان در مقاله سال ۱۹۳۷ با نام «حدود زمانی برای انتخاب» منتشر شد. گاهی از این الگوریتم با نام BFPRT، که حروف اول نام خانوادگی نویسندگان آن است، یاد می‌شود. این الگوریتم بر اساس الگوریتم انتخاب سریع کار می‌کند و هم‌چنین به نام الگوریتم میانه‌ی میانه‌ها شناخته می‌شود.

هرچند انتخاب سریع به طور میانگین دارای زمان خطی است، زمانی که محورهای ضعیفی استفاده شوند می‌تواند به زمان از درجه دوم نیاز پیدا کند (حالتی را در نظر بگیرید که در هر گام، محور در نزدیکی کوچک‌ترین عنصر انتخاب شود). راه چاره برای اینکه آن را به O(n) در بدترین حالت تبدیل کنیم این است که به طور پیوسته در هر گام محور مناسب را بیابیم. یک محور خوب باید به گونه‌باشد که بتوانیم اطمینان داشته باشیم نسبت ثابتی از عناصر قبل از آن و بعد از آن قرار بگیرند.

الگوریتم انتخاب لیست را به گروه‌هایی شامل پنج عنصر تقسیم می‌کند.(فعلاً با عناصر باقی‌مانده کاری نداریم). سپس، برای هر گروه پنج‌تایی، میانه محاسبه می‌شود (اگر آن پنج مقدار داخل ثبّات‌ها بارگذاری شوند و مقایسه شوند، عملیات به طور بالقوه بسیار سریع انجام می‌شود). (اگر مرتب‌سازی به صورت درجا صورت گیرد، این میانه‌ها به یک بلوک پیوسته در لیست منتقل می‌شوند.) انتخاب به صورت بازگشتی در این زیرلیست‌های n/5 عنصری فراخوانده می‌شود تا مقدار واقعی میانه یافت شود. سرانجام، میانه‌ی میانه‌ها به عنوان محور انتخاب می‌شود.





ویژگی‌های محور
محور انتخاب شده، از نیمی از عناصر لیست میانه‌ها بزرگ‌تر و از نیمه‌ی دیگر کوچک‌تر است، به طوری که در هر نیمه n/10 عنصر (1/2 * (n/5)) قرار دارند. هر کدام از این عناصر، میانه‌ی ۵ عنصر است و از ۲ عنصر کوچک‌تر و از ۲ عنصر در خارج از بلوک بزرگ‌تر است. پس، محور کوچک‌تر از 3(n/10) عناصر خارج از بلوک است، و از 3(n/10) عنصر دیگر خارج از بلوک بزرگ‌تر است. بنا بر این، میانه‌ی انتخاب شده، عناصر را به مکانی بین 30%/70% و 70%/30% تقسیم می‌کند. این کار به ما اطمینان می‌دهد که رفتار الگوریتم در بدترین حالت خطی است.



اثبات زمان اجرای (O(n
محاسبه‌ی میانه به طور بازگشتی، در بدترین حالت از درجه خطی بیشتر نخواهد شد، زیرا لیست میانه‌ها ۲۰٪ از اندازه‌ی لیست است، در حالی که فراخوانی بازگشتی دیگر حداکثر روی ۷۰٪ لیست لیست اجرا می‌شود.زمان (O(n ناشی از عمل افراز کردن است ( ما هر عنصر را به تعداد دفعات ثابتی ملاقات می‌کنیم، تا آن‌ها را به گروه‌های (O(n دسته‌بندی کنیم و هر میانه را در زمان (O(n به دست آوریم.




تحلیل الگوریتم‌ها

موضوع تحلیل الگوریتم‌ها تعیین میزان منابعی است که برای اجرای هر الگوریتم لازم است. منابعی مثل زمان، حافظه، پهنای باند ارتباطی، یا سخت افزار رایانه در نظر گرفته می‌شوند. کارآئی یا پیچیدگی هر الگوریتم را با تابعی نشان می‌دهند که تعداد مراحل لازم برای اجرای الگوریتم را برحسب طول داده ورودی، یا میزان محل‌های لازم حافظه را بر حسب طول داده ورودی نشان می‌دهد. زمان متوسط برای بررسی هر الگوریتم با O نشان داده می‌شود غالباً مشاهده می‌شود که یک مسئله را با استفاده از چندین تکنیک مختلف می‌توان حل نمود ولی فقط یکی از آنها به الگوریتمی منجر می‌شود که از بقیه سریعتر است.

در علم کامپیوتر، تجزیه و تحلیل الگوریتم تعیین مقداری از منابع است (مانند زمان و ذخیره سازی) که لازم است آنها را اجرا کند. اکثر الگوریتم‌های طراحی شده برای کار با ورودی‌های با طول اختیاری تولید می‌شوند معمولاً بازده و یا در حال اجرا بودن یک الگوریتم است که به عنوان یک تابع در رابطه با طول ورودی معین را به تعداد مراحل اعلام کرد (پیچیدگی زمانی) و یا مکان‌های ذخیره سازی (پیچیدگی فضا). تجزیه و تحلیل الگوریتم بخشی مهم از تئوری پیچیدگی محاسباتی گسترده تر است، که فراهم می‌کند برآوردهای نظری برای منابع مورد نیاز هر الگوریتم که حل با توجه به محاسبات مشکل است این برآوردها ارائه بینشی به جهت معقول برای جستجوی الگوریتم‌های کارآمد است.

در تجزیه و تحلیل نظری الگوریتم آن که مشترک است به منظور برآورد پیچیدگی خود در معنای تقریبی به عنوان مثال، به منظور برآورد تابع پیچیدگی برای ورودی خودسرانه بزرگ. نماد O بزرگ، امگا و تتا برای این منظور استفاده می‌شود. مثلاً گفته می‌شود، جستجوی دودویی به اجرا در تعدادی از مراحل، متناسب با لگاریتم طول این لیست در حال جستجو و یا در (O(log(n). معمولاً تخمین‌های تقریبی استفاده می‌شود چرا که پیاده سازی‌های مختلف از همان الگوریتم ممکن در کارایی متفاوت است. با این حال بازده هر دو "منطقی" پیاده سازی یک الگوریتم داده شده ضرب در یک ضریب ثابت به نام ثابت مخفی مرتبط است.

اغلب مهم است که بدانید برای چه مقدار از یک منبع خاص (مثل زمان یا حافظه) تئوری مورد نیاز برای یک الگوریتم داده شده. روش‌ها برای تجزیه و تحلیل الگوریتم‌های توسعه یافته برای به دست آوردن مقادیر کمی (تخمین)؛به عنوان مثال، الگوریتم مرتب سازی در بالای یک زمان مورد نیاز از (O(N، با استفاده از نماد گذاری O بزرگ با n به عنوان طول لیست در تمام زمانها در الگوریتم باید دو مقدار را به خاطر داشته باشید: بیشترین تعداد تا کنون و موقعیت فعلی در لیست ورودی. لذا گفته شده است که فضای مورد نیاز از (۱)O است در صورتی که برای ذخیره، شماره‌های ورودی شمارش نمی‌شود یا (O(n آن شمارش شده.
ساعت : 1:07 am | نویسنده : admin | مطلب قبلی | مطلب بعدی
الگوریتم | next page | next page