پرش به مطلب اصلی

راهنمای کاربری استفاده از سرویس LLM

در ادامه، راهنمای استفاده از سرویس LLM ابرآمد و نحوه دسترسی و استفاده از این مدل‌ها در سامانه به‌صورت مرحله‌به‌مرحله توضیح داده خواهد شد.

راهنمای دسترسی و احراز هویت در سرویس LLM

این راهنما نحوه احراز هویت و دسترسی امن به مدل‌های زبانی بزرگ (LLM) مستقر در پلتفرم ML ابرآمد را توضیح می‌دهد. برای استفاده از این مدل‌ها لازم است ابتدا فرآیند احراز هویت انجام شود تا تنها کاربران مجاز بتوانند درخواست‌های پردازشی خود را به مدل‌ها ارسال کنند.

تمامی سرویس‌های LLM از طریق API در دسترس هستند و برای ارسال درخواست به آن‌ها باید یک Access Token معتبر دریافت شود.

پیش‌نیازها

پیش از شروع، موارد زیر باید در اختیار شما باشند:

  • نام کاربری و رمز عبور برای احراز هویت
  • آدرس URL سرویس مدل
  • ایجاد یک ماشین مجازی در پلتفرم ابرآمد

گام اول: ویرایش فایل Host

ابتدا وارد ماشین مجازی ایجادشده در پلتفرم ابرآمد شوید. سپس مسیر زیر را دنبال کنید:

C:\Windows\System32\drivers\etc

در این مسیر فایل hosts را باز کرده و خط زیر را به انتهای فایل اضافه کنید:

gpt-oss-120b.ml.abramad.com 185.119.242.15

gemma3-12b.ml.abramad.com 185.119.242.15

emb-rr.ml.abramad.com 185.119.242.15

qwen3-coder-30b.ml.abramad.com 185.119.242.15

پس از اضافه‌کردن این مقادیر، فایل را ذخیره کنید.

گام دوم: احراز هویت و دریافت Access Token

برای دسترسی به API مدل‌ها باید ابتدا یک OAuth2 Access Token دریافت کنید.

نکته: اعتبار این توکن ۲۴ ساعت است.

در محیط Terminal ماشین مجازی، دستور زیر را اجرا کنید:

در این دستور باید مقادیر زیر را با اطلاعات خود جایگزین کنید:

  • username : ایمیل کاربری شما

  • password : رمز عبور حساب کاربری

جدول ۱: متغیرهایی که هنگام فرخوانی خدمات هوش مصنوعی باید تعیین کنید.

valueVariable
YOUR_PASSWORDpassword
YOUR_EMAIL (example = sg-vna@ml.abramad.com)username

نمونه پاسخ دریافتی:

پس از دریافت پاسخ، می‌توانید از مقدار access_token برای احراز هویت در درخواست‌های API استفاده کنید.

گام سوم: فرخوانی سرویس ها

سرویس‌های قابل‌استفاده

در پلتفرم ابرآمد چند مدل هوش مصنوعی در دسترس قرار دارد که از طریق API قابل‌استفاده هستند.

مدل‌های زبانی (LLM)

  • gpt-oss-120b

  • qwen3-coder-30b

  • gemma3-12b

سرویس Embedding و Re-ranker

  • emb-rr

آدرس سرویس‌ها

برای دسترسی به سرویس‌های هوش مصنوعی از آدرس‌های زیر استفاده می‌شود:

AI Services API
Access (Auth is required)
emb-rr.ml.abramad.com
gemma3-12b.ml.abramad.com
gemma3-12b.ml.abramad.com
qwen3-coder-30b.ml.abramad.com

تمامی درخواست‌ها باید از طریق HTTPS ارسال شوند و وجود هدر Authorization الزامی است.

دریافت فهرست مدل‌ها

برای مشاهده فهرست مدل‌های در دسترس می‌توانید از دستور زیر استفاده کنید:

در این دستور باید مقدار < ACCESS_TOKEN > با توکن معتبر جایگزین شود.

مثال: Chat Completion

نمونه درخواست برای ارسال پیام به مدل:

در این درخواست باید مقدار ${THE_MODEL_NAME}با نام مدلی که استفاده می‌کنید جایگزین شود.

مثال: Completion ساده

نمونه درخواست برای تولید متن:

مثال: فرخوانی سرویس Embedding مدل E5 ( با یک ورودی )

نمونه درخواست برای ارسال پیام به مدل:

مثال: فرخوانی سرویس Embedding مدل E5 با دو ورودی ( Batch Mode )

نمونه درخواست برای تبدیل چند متن به بردارهای Embedding به‌صورت همزمان (Batch) برای استفاده در جستجوی معنایی، خوشه‌بندی یا سیستم‌های بازیابی اطلاعات:

مثال: فرخوانی سرویس Embedding مدل BGE

نمونه درخواست برای تولید بردار Embedding از متن ورودی با استفاده از مدل BGE برای استفاده در جستجوی معنایی یا مقایسه شباهت متون:

مثال: فرخوانی Reranker در پایتون

نمونه کد پایتون برای امتیازدهی مجدد (Re-ranking) به مجموعه‌ای از نتایج متنی بر اساس میزان ارتباط آن‌ها با یک پرسش:

نکات امنیتی و محدودیت‌ها

  • از ذخیره Access Token در کدهای سمت کاربر (Frontend) خودداری کنید.
  • در صورت افشای توکن، بلافاصله توکن جدید دریافت کنید.
  • تعداد درخواست‌ها (Rate Limit) بسته به نوع سرویس و سطح دسترسی ممکن است محدود باشد.
  • ارسال ورودی‌های نامعتبر یا استفاده نادرست از سرویس ممکن است باعث مسدود‌شدن موقت دسترسی شود.

خطاهای رایج

Error CodeMeaningResolution
401Unauthorizedتوکن تاریخ مصرف گذشته است یا معتبر نیست. مجددا توکن دریافت کنید
403Forbiddenکاربر مجوز این دسترسی را ندارد
404Not Foundنام مدل یا url اشتباه است
422Unpossessable Entityقالب ورودی معتبر نیست – ورودی خود را مجددا چک بفرمایید

نکته: تمامی درخواست‌ها را می‌توان علاوه بر curl با ابزارهایی مانند Postman نیز ارسال و آزمایش کرد.