خبر یزد

آخرين مطالب

هوش مصنوعی یا توهم مصنوعی؟ نتایج ناامیدکننده آزمایش ایجنت جدید ChatGPT علمي

هوش مصنوعی یا توهم مصنوعی؟ نتایج ناامیدکننده آزمایش ایجنت جدید ChatGPT
  بزرگنمايي:

خبر یزد - گجت نیوز / آزمایش‌های گسترده ایجنت جدید ChatGPT نتایجی دور از انتظار را رقم زد. آیا این ابزار قدرتمند واقعا قابل اعتماد است یا با توهمات خود ما را به اشتباه می‌اندازد؟
بررسی‌های جامع و دقیق روی ابزار جدید OpenAI نشان می‌دهد که ایجنت جدید ChatGPT علی‌رغم توانایی‌های بالقوه، هنوز فاصله زیادی تا تبدیل شدن به یک دستیار قابل اعتماد دارد و در بسیاری از موارد، حقایق جایگزین و اطلاعات نادرست تولید می‌کند. این ابزار که قرار است ترکیبی از تحقیق عمیق و اجرای دستورات در محیط کامپیوتر باشد، در عمل با چالش‌های جدی روبرو است.
بازار
دیوید گیرویتز، نویسنده ارشد وب‌سایت ZDNET، در یک گزارش مفصل، تجربه خود از کار با این ایجنت را به اشتراک گذاشته است. او برای این آزمایش، اشتراک حرفه‌ای 200 دلاری OpenAI را تهیه کرد تا بتواند قابلیت‌های این مدل را به چالش بکشد. نتایج کلی این آزمایش‌ها نشان می‌دهد که اگرچه ChatGPT درک درستی از صورت مسئله دارد، اما در اکثر موارد خروجی‌های آن غیرقابل استفاده و مملو از خطا هستند.
عملکرد کلی ایجنت جدید ChatGPT چگونه بود؟
در نگاه اول، این ابزار بسیار قدرتمند به نظر می‌رسد. ایجنت جدید ChatGPT می‌تواند پنجره‌ها را باز کند، روی عناصر مختلف کلیک کند و وظایف مشخصی را انجام دهد. با این حال، آزمایش‌های متعدد نشان داد که این ابزار محدودیت‌های قابل توجهی دارد. برای مثال، در پروژه‌های بزرگ و تحلیل داده‌های حجیم با مشکل مواجه می‌شود و حتی نمی‌تواند صفحات وب طولانی را به درستی اسکرول کند.
یکی از مشکلات اصلی، توهم یا Hallucination هوش مصنوعی است. این مدل گاهی اطلاعاتی را با اطمینان کامل ارائه می‌دهد که هیچ پایه و اساس واقعی ندارند. این موضوع به ویژه زمانی نگران‌کننده می‌شود که کاربران بخواهند از خروجی‌های آن برای مقاصد حرفه‌ای استفاده کنند. نویسنده گزارش تاکید می‌کند که بدون بررسی و اعتبارسنجی دقیق، اعتماد به داده‌های این ایجنت می‌تواند بسیار پرخطر باشد.شکست در وظایف ساده و موفقیت در یک چالش پیچیده
گیرویتز هشت آزمون مختلف را برای ارزیابی عملکرد ایجنت طراحی کرد. در یکی از این آزمون‌ها، از ایجنت خواسته شد تا ابزارهای لازم برای ساخت کابل شبکه را از وب‌سایت آمازون پیدا کند. اگرچه مدل توانست یک کیت اقتصادی و مناسب را پیشنهاد دهد، اما لینک‌های ارائه شده برای محصولات گران‌تر همگی نامعتبر و ساختگی بودند. این نشان می‌دهد که ایجنت توانایی اعتبارسنجی منابع خود را ندارد.
در آزمون دیگری، از ایجنت خواسته شد تا یک اسلاید پاورپوینت را بر اساس داده‌های جدید ویرایش کند. مدل توانست داده جدید را به نمودار اضافه کند، اما کیفیت گرافیکی، فونت‌ها و چینش عناصر کاملا به هم ریخته بود. این نتایج نشان می‌دهد که ابزار هنوز برای تولید محتوای بصری حرفه‌ای آماده نیست.
با این حال، همه چیز ناامیدکننده نبود. در آخرین آزمون، از ایجنت خواسته شد تا قوانین ساختمانی مربوط به نصب یک حصار را در یک منطقه مشخص تحلیل کند. در کمال شگفتی، ایجنت جدید ChatGPT در عرض تنها چهار دقیقه، یک تحلیل دقیق و صحیح همراه با نمودارهای کاربردی ارائه داد. این خروجی آنقدر باکیفیت بود که می‌توانست مستقیما برای مراحل بعدی پروژه مورد استفاده قرار گیرد. این موفقیت نشان‌دهنده پتانسیل بالای این فناوری در صورت توسعه و بهبود است.آیا می‌توان به این دستیار هوشمند اعتماد کرد؟
پاسخ کوتاه، خیر است. حداقل نه در حال حاضر. عملکرد این ابزار بیشتر شبیه یک دستیار بی‌تجربه و غیرقابل پیش‌بینی است که گاهی درخشان عمل می‌کند و گاهی نتایج کاملا اشتباه تحویل می‌دهد. این فناوری بدون شک آینده هیجان‌انگیزی را نوید می‌دهد، اما در وضعیت فعلی، نمی‌تواند جایگزین یک نیروی انسانی متخصص و قابل اعتماد شود.
کاربران باید با احتیاط فراوان از این ابزار استفاده کنند و هرگز خروجی‌های آن را بدون بررسی مجدد، مبنای تصمیم‌گیری‌های مهم خود قرار ندهند. به نظر می‌رسد باید منتظر بمانیم تا ببینیم OpenAI چگونه بر این چالش‌ها غلبه خواهد کرد و آیا نسل‌های بعدی این ایجنت‌ها می‌توانند به سطح قابل قبولی از اطمینان و دقت برسند یا خیر.

لینک کوتاه:
https://www.khabareyazd.ir/Fa/News/736401/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

فناوری جدید کره جنوبی برای جلوگیری از انفجار باتری لیتیومی

رشفورد چقدر به بارسلونا تخفیف داد؟

ایران 2- اسپانیا 3؛ شوک بزرگ به شاگردان عادل

استقلال - چادرملو، هشت روز قبل از تراکتور

با انصراف نمایندگان کشورمان؛ پست نایب رئیسی تکواندو آسیا از دست رفت

پدیده تیم ملی زوج سید در شهداب

پرداخت 88 درصد تسهیلات دانش‌بنیان ها توسط بانک‌های غیردولتی

تاکید بر نقش حیاتی نخبگان ایثارگری در عبور کشور از "جنگ ترکیبی"

غزه، آزمون وجدان بشریت

ثبت‌نام 12 هزار یزدی برای پیاده‌روی اربعین

توضیحات آبفا در خصوص توزیع آب بسته‌بندی شده در تهران

50 کیلومتر از باند دوم محور یزد-طبس به بهره‌برداری رسید

بازدید معاون وزیر راه و شهرسازی از پروژه کمربندی زارچ - اشکذر

ادای احترام مسئولان ملی و استانی به مقام شامخ شهدای اردکان

بررسی میدانی مشکلات کمربندی یزد - اشکذر در بازدید شبانه معاون وزیر راه

ورزش عصرگاهی، امیدی تازه‌ برای کاهش افسردگی در سالمندان

اجرای طرح ارتقای امنیت و آرامش در اشکذر

جزئیات نرخ فروش ارز اربعین اعلام شد

اسکناس 20 یورویی بین فرانسه و لهستان دعوا انداخت

مادر شهیدان والامقام «بی باک» از قائم شهر مازندران آسمانی شد

ادای احترام معاون وزیر راه و شهرسازی به خانواده شهید والامقام جوکار در یزد

برنامه‌ریزی دقیق برای مدیریت آب کشاورزی یزد/ کارگروه فنی تشکیل می‌شود

شتاب در تکمیل پروژه‌های راهسازی یزد؛ اولویت اصلی کارگروه راه‌های استان

تصمیم عجیب بایرن؛ نه به ستاره پرطرفدار اروپا!

رونالدو باید سال 2021 به سیتی می‌رفت

بهره‌برداری از 50 کیلومتر باند دوم محور یزد ـ طبس

خبر جدید درباره قیمت گندم و پرداخت مطالبات گندمکاران

تلاقی اینترنت کوانتومی با فضا-زمان در یک ایده مبتکرانه

آزمون های زائد محیط زیستی برای خودروهای نو وارداتی  حذف شد

قیمت نفت با خوش‌بینی بازار صعودی شد

مراسمی به یاد شهدای کاراته استان

آخرین شایعات درباره محمدرضا اخباری در سپاهان

ماندگاری گرما در استان یزد

دلیل کاهش قیمت تخم مرغ در روزهای اخیر

«مبارزه با آلزایمر» با داروهای تایید شده سرطان

مناسبت روز/ پنج‌شنبه، 2 مردادماه

اوقات شرعی پنجشنبه 2 مرداد 1404 به افق یزد

طلای جهانی در سراشیبی ماند

کولر جدید ناسا برای سفر به مریخ

ضربه بزرگ به سپاهان؛ خداحافظ ستاره!

سایه سنگین خاموشی بر فولادسازان

26 بازیکنی که ساپینتو برای مدیریت ایمیل کرد

سقف ارزی جدید برای واردات قهوه اعلام شد

پیشگامان واقعی؛ وویجرها نخستین کاوشگران مرزهای منظومه شمسی نبودند

رمز استقلال و انگیزه زندگی در «دوران پیری»

هابل برای اولین بار دنباله‌دار «31/اطلس» را رصد کرد

عکس روز ناسا از پرواز یک گوی آتشین بر فراز فلوریدا

بینایی فضانوردان طی ماموریت‌ها مختل می‌شود

تهدید نامرئی در اعماق آب: میلیاردها ذره نانوپلاستیک در اقیانوس اطلس شناور است

اورانوس سیاره سردی نیست