<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>بایگانی‌های بازی - شرکت شبیه پردازان</title>
	<atom:link href="https://www.shabihpardazan.com/tag/%D8%A8%D8%A7%D8%B2%DB%8C/feed/" rel="self" type="application/rss+xml" />
	<link></link>
	<description>شبیه سازی، بهینه سازی، دوقلوی دیجیتال، یادگیری ماشین</description>
	<lastBuildDate>Wed, 10 Aug 2022 15:03:06 +0000</lastBuildDate>
	<language>fa-IR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	

<image>
	<url>https://www.shabihpardazan.com/wp-content/uploads/2026/05/cropped-Untitled-4-1-32x32.jpg</url>
	<title>بایگانی‌های بازی - شرکت شبیه پردازان</title>
	<link></link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>عملکرد الگوریتم یادگیری تقویتی</title>
		<link>https://www.shabihpardazan.com/%d8%b9%d9%85%d9%84%da%a9%d8%b1%d8%af-%d8%a7%d9%84%da%af%d9%88%d8%b1%db%8c%d8%aa%d9%85-%db%8c%d8%a7%d8%af%da%af%db%8c%d8%b1%db%8c-%d8%aa%d9%82%d9%88%db%8c%d8%aa%db%8c/</link>
					<comments>https://www.shabihpardazan.com/%d8%b9%d9%85%d9%84%da%a9%d8%b1%d8%af-%d8%a7%d9%84%da%af%d9%88%d8%b1%db%8c%d8%aa%d9%85-%db%8c%d8%a7%d8%af%da%af%db%8c%d8%b1%db%8c-%d8%aa%d9%82%d9%88%db%8c%d8%aa%db%8c/#respond</comments>
		
		<dc:creator><![CDATA[مدیر سایت]]></dc:creator>
		<pubDate>Sun, 03 Jul 2022 09:24:45 +0000</pubDate>
				<category><![CDATA[یادگیری تقویتی]]></category>
		<category><![CDATA[Reinforcement Learning]]></category>
		<category><![CDATA[RL]]></category>
		<category><![CDATA[بازی]]></category>
		<category><![CDATA[بازی آتاری]]></category>
		<category><![CDATA[عملکرد یادگیری تقویتی]]></category>
		<guid isPermaLink="false">https://www.shabihpardazan.com/?p=26456</guid>

					<description><![CDATA[<p>نوشته <a href="https://www.shabihpardazan.com/%d8%b9%d9%85%d9%84%da%a9%d8%b1%d8%af-%d8%a7%d9%84%da%af%d9%88%d8%b1%db%8c%d8%aa%d9%85-%db%8c%d8%a7%d8%af%da%af%db%8c%d8%b1%db%8c-%d8%aa%d9%82%d9%88%db%8c%d8%aa%db%8c/">عملکرد الگوریتم یادگیری تقویتی</a> اولین بار در <a href="https://www.shabihpardazan.com">شرکت شبیه پردازان</a>. پدیدار شد.</p>
]]></description>
										<content:encoded><![CDATA[<section class="l-section wpb_row height_small color_alternate"><div class="l-section-h i-cf"><div class="g-cols via_flex valign_top type_default"><div class="vc_col-sm-2 wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_wrapper"><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div></div></div><div class="vc_col-sm-8 wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_wrapper"><div class="wpb_text_column"><div class="wpb_wrapper">
    <div style="max-width:900px;">        
    <video id="plyr6a1619cbf184b" controls class="easy-video-player wp-video2">
       <source src="https://www.shabihpardazan.com/clips/RL.mp4" type="video/mp4" />
    </video>
    </div>    <script>
        const evplayerplyr6a1619cbf184b = new Plyr(document.getElementById('plyr6a1619cbf184b'));
        evplayerplyr6a1619cbf184b.ratio = '4:3';
        evplayerplyr6a1619cbf184b.iconUrl = 'https://www.shabihpardazan.com/wp-content/plugins/easy-video-player/lib/plyr.svg';
        evplayerplyr6a1619cbf184b.blankVideo = 'https://www.shabihpardazan.com/wp-content/plugins/easy-video-player/lib/blank.mp4';  
    </script>
</div></div></div></div></div><div class="vc_col-sm-2 wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_wrapper"></div></div></div></div></div></section><section class="l-section wpb_row height_small"><div class="l-section-h i-cf"><div class="g-cols via_flex valign_top type_default"><div class="vc_col-sm-12 wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_wrapper"><div class="wpb_text_column"><div class="wpb_wrapper"><p style="text-align: justify;">یادگیری تقویتی (Reinforcement Learning) و یا به اختصار (RL) یکی از زیرشاخه های یادگیری ماشینی  (Machine Learning) است. در این رویکرد، عامل یادگیرنده با استفاده از الگوریتم یادگیری محیط، اقداماتی را در محیط انجام می‌دهد و پاداش اقدام خود را مشاهده می‌کند. این فرآیند به گونه‌ای ادامه پیدا می‌کند که عامل اقداماتی را انجام می‌دهد که پاداش دریافتی بیشینه می‌گردد.</p>
<p style="text-align: justify;">نحوه انتخاب اقدام توسط عامل در هر وضعیت متاثر از ارزش آن اقدام در وضعیت مشخص است. هدف اصلی عامل حداکثر کردن پاداش دریافتی فعلی و آتی است.</p>
<p style="text-align: justify;">در سالهای اخیر به دلیل ارتباطی که بین الگوریتمهای RL و شبکه های عصبی (Neural Network) به وجود آمده است، شاخه جدیدی به عنوان یادگیری تقویتی عمیق (Deep Reinforcement Learning) و یا به اختصار DRL به وجود آمده است. رویکرد DRL کاربردهای بسیار متنوعی در صنایع، بازارهای مالی، سیستمهای سلامت، بازیهای کامپیوتری و خودروهای خودران و &#8230; دارد.</p>
<p style="text-align: justify;">در سال 2015 آقای دیوید سیلور (David Silver) به همراه همکاران خود عملکرد الگوریتم <a href="https://arxiv.org/abs/1509.06461?context=cs">DDQN</a> را در انجام بازیهای کامپیوتری نشان دادند و نتایج آن خیره کننده بود. در بسیاری از بازیها، عامل یادگیرنده با استفاده از الگوریتم DDQN موفق به بهبود بهترین رکورد به دست آمده شده بود.</p>
<p style="text-align: justify;">به منظور آشنایی بیشتر با عملکرد الگوریتم های RL و DRL، در زیر کلیپ از عملکرد عامل یادگیرنده با استفاده از DRL برای انجام بازیهای آتاری آورده شده است. مشاهده خواهد شد که عامل در ابتدای انجام بازی، اقدامات بدون هدفی را انتخاب می‌کند. ولی بعد از گذشت زمان، رفته رفته عملکرد مطلوبی از خود نشان می‌دهد.</p>
<p style="text-align: justify;">جهت آشنایی بیشتر با الگوریتمهای یادگیری تقویتی مطالب&#8221;<a href="https://www.shabihpardazan.com/%db%8c%d8%a7%d8%af%da%af%db%8c%d8%b1%db%8c-%d8%aa%d9%82%d9%88%db%8c%d8%aa%db%8c/"><strong>یادگیری تقویتی چیست</strong>؟</a>&#8221; و &#8220;<strong><a href="https://www.shabihpardazan.com/%da%a9%d8%a7%d8%b1%d8%a8%d8%b1%d8%af-%db%8c%d8%a7%d8%af%da%af%db%8c%d8%b1%db%8c-%d8%aa%d9%82%d9%88%db%8c%d8%aa%db%8c/">کاربرد یادگیری تقویتی</a></strong>&#8221; را مطالعه نمایید.</p>
</div></div></div></div></div></div></div></section>
<p>نوشته <a href="https://www.shabihpardazan.com/%d8%b9%d9%85%d9%84%da%a9%d8%b1%d8%af-%d8%a7%d9%84%da%af%d9%88%d8%b1%db%8c%d8%aa%d9%85-%db%8c%d8%a7%d8%af%da%af%db%8c%d8%b1%db%8c-%d8%aa%d9%82%d9%88%db%8c%d8%aa%db%8c/">عملکرد الگوریتم یادگیری تقویتی</a> اولین بار در <a href="https://www.shabihpardazan.com">شرکت شبیه پردازان</a>. پدیدار شد.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://www.shabihpardazan.com/%d8%b9%d9%85%d9%84%da%a9%d8%b1%d8%af-%d8%a7%d9%84%da%af%d9%88%d8%b1%db%8c%d8%aa%d9%85-%db%8c%d8%a7%d8%af%da%af%db%8c%d8%b1%db%8c-%d8%aa%d9%82%d9%88%db%8c%d8%aa%db%8c/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		<enclosure url="http://www.shabihpardazan.com/clips/RL.mp4" length="0" type="video/mp4" />

			</item>
	</channel>
</rss>
