Reddit در تلاشی برای جلوگیری از استفاده آزادانه شرکتهای هوش مصنوعی از محتوای آن برای آموزش مدلهای زبان بزرگ، دسترسی پولی Data API را اعلام کرد. Reddit این هفته شرایط بهروزرسانیشدهای را برای ابزارها و خدمات توسعهدهنده، دسترسی پولی به Reddit Data API و ابزارهای تعدیل بومی بیشتر اعلام کرد. در حالی که وبلاگ Reddit تغییرات را به عنوان بخشی از ایجاد یک اکوسیستم سالم توضیح داد ، نیویورک تایمز گزارش داد که دسترسی به API پولی شرکتهای بزرگ را از استفاده رایگان از محتوای Reddit برای آموزش مدلهای زبان بزرگ (LLM) باز میدارد.
Reddit از پیشگامان توییتر پیروی می کند، API دسترسی پولی به داده ها را اعلام می کند
اسناد به روز شده تأیید می کند که توسعه دهندگان فقط می توانند از محتوای Reddit برای آموزش LLM با تأیید قبلی Reddit استفاده کنند و این به منزله دسترسی تجاری است. بارد نمی تواند تأیید کند که آیا Google محتوای Reddit را در داده های آموزشی خود به عنوان بخشی از مجموعه داده های عمومی در دسترس «احتمالاً استفاده شده» گنجانده است یا خیر. ChatGPT نمی تواند فهرست خاصی از منابع را به اشتراک بگذارد، اما Reddit ممکن است یکی از آنها باشد.
هوش مصنوعی بینگ تأیید میکند که مایکروسافت از منابع داده متعددی از جمله شاخص و الگوریتم بینگ با مدلهای OpenAI GPT استفاده میکند. با توجه به اینکه ChatGPT ممکن است از دادههای Reddit استفاده کرده باشد، میتوان حدس زد که مایکروسافت نیز از طریق مشارکت خود با OpenAI استفاده کرده است.
چقدر به API داده Reddit دسترسی خواهد داشت؟
طبق شرایط بهروزرسانیشده توسعهدهنده – از ۱۹ ژوئن ۲۰۲۳ – Reddit برای آنچه دسترسی تجاری و استفاده از API میداند هزینهای را دریافت میکند: اگر یک کسب و کار یا خدمات پولی با API متصل شود، دسترسی تجاری محسوب می شود. اگر یک کسب و کار یا خدمات به طور مستقیم یا غیرمستقیم از هر داده Reddit یا داده های مشتق شده درآمد ایجاد کند. موارد زیر نمونههای خاصی از خدمات کسب درآمد از صفحه پلتفرم برنامهنویس Reddit هستند :
خدماتی که از تبلیغات و دیوارهای پرداخت درآمد ایجاد می کنند. موتورهای جستجویی که از تبلیغات درآمدزایی می کنند.خدماتی که از کاربران برای دسترسی به تحقیقات یا داده ها هزینه دریافت می کنند. خدماتی که کاربران برای آنها هزینه اشتراک پرداخت می کنند.خدماتی که در محصول دیگری به فروش می رسد. خدماتی که محتوای Reddit را در وبسایتها و برنامههای کسب درآمد منتشر میکنند. سرویس هایی که از داده های Reddit برای مدل های آموزشی استفاده می کنند.
محققانی که از API برای مقاصد غیرتجاری استفاده میکنند، در صورتی که موافقت کنند دادههای حساس Reddit یا محصولات ساختهشده با استفاده از محتوای Reddit را منتشر نکنند، ممکن است به این کار ادامه دهند. دسترسی به حجم زیادی از داده ها ممکن است برای پوشش هزینه های مرتبط با دسترسی انبوه به API مستلزم هزینه باشد. کریستوفر اسلو، مدیر ارشد فناوری Reddit، در مورد یک بحث یادگیری ماشینی در مورد این خبر اظهار نظر کرد و نوشت:
ما در مورد تحقیقات LLM و ML هیجان زده هستیم و به طور کلی به نقشی که Reddit در این کار در طول سال ها ایفا کرده است بسیار مفتخریم. بنابراین، در حالی که ما باید بیشتر تلاش کنیم تا اطمینان حاصل کنیم که دادههای کاربرانمان به شیوهای مسئولانه به اشتراک گذاشته میشود، اما به دنبال جلوگیری از تحقیقات دانشگاهی یا کسب درآمد از محققان نیستیم.»
توسعه دهندگان همچنین باید بپذیرند که محتوای کاربر در Reddit متعلق به کاربران است و مشمول حقوق و محدودیتهای استفاده مشخص شده توسط کاربر است. قرارداد کاربر تأیید می کند که کاربران حقوق محتوای خود را حفظ می کنند، اما آنها همچنین مجوز استفاده از آن را بدون حق امتیاز به Reddit می دهند. Reddit جزئیات قیمت را به محض نهایی شدن به اشتراک خواهد گذاشت. Reddit به گردانندگان اطمینان داد که تغییرات API بر ابزارهایی که به اجرای قوانین subreddit و حذف محتوایی که خطمشیهای Reddit را نقض میکنند، کمک نمیکند .
گردانندگان تشویق می شوند که زیرمجموعه Mod News را دنبال کنند تا در مورد آخرین پیشرفت ها در ابزارهای تعدیل به روز بمانند. بر اساس گزارشها ، Reddit تلاش میکند تا اعتدال جامعه را سختتر نگه دارد تا تبلیغکنندگان را راضی نگه دارد.
آیا Reddit Data API ابزارهای مدیریت رسانه اجتماعی خواهد بود؟
اگر از هر ابزار شخص ثالثی برای پست کردن در Reddit، جستجوی پستها در Reddit یا ایجاد گزارشهای تحلیلی برای حساب Reddit خود استفاده میکنید، سه راه وجود دارد که میتواند بر شما تأثیر بگذارد. ممکن است از طریق برخی خدمات شخص ثالث به دسترسی بیشتری به ویژگی های Reddit نیاز داشته باشید.ممکن است مجبور شوید برای برخی از خدمات شخص ثالثی که زمانی برنامه های قیمت گذاری رایگان را برای جذب هزینه افزایش یافته دسترسی به Reddit Data API ارائه می کردند، پرداخت کنید. ممکن است مجبور شوید برای برخی از خدمات شخص ثالث بیش از آنچه قبلاً پرداخت کرده اید، پرداخت کنید.
زمانی که Reddit جزئیات قیمت گذاری API را منتشر کرد، تأثیر آن را خواهیم دید. پلتفرم هایی که با Reddit ادغام می شوند عبارتند از Zapier، HootSuite ، IFTTT ، Feedly ، Vista Social ، Tray.io ، و Social Rise . این پلتفرمها به کاربران اجازه میدهند تا بینشهای ارزشمندی در مورد تعامل Reddit کسب کنند. در مورد اینکه اگر ابزار مدیریت رسانه های اجتماعی شما هزینه را به کاربرانش منتقل کند، چه نوع افزایشی را می توانید انتظار داشته باشید: برای خدمات شخص ثالث با بیش از یک میلیون کاربر، این هزینه می تواند به اندازه یک دلار اضافی در ماه برای هر کاربر باشد. برای خدماتی که کاربران کمتری دارند، ممکن است بسیار بیشتر باشد.
اخبار مرتبط: چگونه تغییرات در API توییتر خدمات محبوب را مختل کرد
دو هفته پس از اینکه کاربران شروع به پخش تصاویری مبنی بر قیمت گذاری سازمانی برای API توییتر کردند، توییتر به طور رسمی وب سایت خود را با برنامه های قیمت گذاری برای دسترسی پریمیوم به Twitter API v2 به روز کرد. این به توسعه دهندگان اجازه می دهد تا برنامه هایی بسازند که داده ها را از توییتر بازیابی و تجزیه و تحلیل می کنند – به این ابزارها اجازه می دهد توییت ها را در یک موضوع خاص جستجو کنند، تأثیرگذارها را کشف کنند و گزارش های تحلیلی درباره مخاطبان و تعامل حساب توییتر ایجاد کنند.
API همچنین به برنامهها اجازه میدهد تا بهروزرسانیهایی را در توییتر ارسال کنند، که به ابزارهای مدیریت رسانههای اجتماعی امکان برنامهریزی و ارسال توییتها را به یک حساب میدهد . توییتر سه گزینه قیمت گذاری برای API v2 ارائه می دهد . توییتر از کاربرانی که به داده های بیشتری نیاز دارند دعوت کرد تا برای دسترسی به API سازمانی از طریق فرم Google درخواست دهند .
APIهای سازمانی پوشش همزمان توییتهای عمومی را با اپراتورها و قوانین خاص، فیلتر جستجوی پیشرفته، دسترسی کامل تاریخی به توییتهای بایگانیشده و فعالیت حساب توسط کاربران خاص (توییتها، پاسخها، دنبالکردن، لایکها، بلوکها و غیره) ارائه میدهند. توییتر قیمت گذاری برای دسترسی به API توییتر در سطح سازمانی را در وب سایت خود فهرست نمی کند. توییتی که توسط Wired به اشتراک گذاشته شده است ، محدوده قیمت ماهانه 42000 تا 210000 دلار را پیشنهاد می کند.
در اینجا اسناد است. “بسته بزرگ” 210000 دلار در ماه یا 2.5 میلیون دلار در سال است (نکته @techmeme ) https://t.co/RfGyWqpIgF pic.twitter.com/xuBiCBzoe7 — کریس استوکل-واکر ~ @stokel@infosec.exchange (@stokel) 10 مارس 2023
به گفته کاربران جوامع توسعه دهندگان خصوصی توییتر که برای اطلاعات بیشتر با این پلتفرم تماس گرفته اند، هیچ برنامه ای بین Basic (با 100 دلار در ماه) و Enterprise ارائه نمی دهد. توییتر همچنین نسخههای قبلی API از جمله استاندارد (v1.1)، Essential (v2)، Elevated (v2) و سطوح دسترسی Premium API را کاهش داد . افزایش هزینه ها و دسترسی مستهلک شده بر خدمات زیر که به API توییتر متکی هستند تأثیر گذاشت. هشدارهای هواشناسی نجات دهنده از چندین حساب خدمات هواشناسی ملی محدود بود.
IFTTT، یک سرویس اتوماسیون با 18 میلیون کاربر ، با تغییرات API که در ابتدای آوریل انجام شد، با مشکلاتی مواجه شد . Feedly، یک سرویس خبرخوان که ویژگیهای هوش مصنوعی را در سال 2020 برای بیش از 18 میلیون کاربر یکپارچه کرد، ویژگیهای توییتر را بازنشسته کرد و شروع به کاوش در ادغام با Mastodon کرد. Flipboard، یک سرویس جمعآوری اخبار با 145 میلیون کاربر ، اعلام کرد که فیدهای توییتر شکسته میمانند و Mastodon در آینده خود خواهد بود. HootSuite، یک ابزار مدیریت رسانه های اجتماعی با 18 میلیون کاربر ، ارائه طرح های رایگان را به کاربرانی که توییتر و سایر پروفایل های اجتماعی را مدیریت می کنند، متوقف کرد.
ایلان ماسک، مدیرعامل توییتر (Now X Corp) گفت که دسترسی به API پولی باعث کاهش سوء استفاده از ربات می شود . او همچنین پیشنهاد کرد که امتناع مایکروسافت از پرداخت هزینههای API توییتر میتواند منجر به شکایت به اتهام «پارهکردن پایگاه داده توییتر» و «فروش دادههای [توئیتر] ما به دیگران شود». گیت هاب، مایکروسافت و OpenAI با یک شکایت دسته جمعی در سانفرانسیسکو، کالیفرنیا، به دلیل استفاده از محتوای تولید شده توسط کاربر ارسال شده، با نقض چندین دستورالعمل مجوز منبع باز روبرو هستند. مایکروسافت ، گیت هاب و OpenAI خواستار رد این شکایت شده اند.
همین شرکت همچنین یک شکایت دسته جمعی علیه Stability AI، DeviantArt و Midjourney به دلیل استفاده از Stable Diffusion، متهم به استفاده از هنر دارای حق چاپ در داده های آموزشی خود، تنظیم کرد.