یک الگوریتم GAN باید تعریف بشه تا در یک شبکه حسگر بی سیم مسیر تولید کنه ، مسیر ها توسط یک الگوریتم QLearning ارزیابی بشن و عامل (یعنی حسگر) بسته هارو از مسیری که گفته شده ارسال کنه و تابع پاداش و Q براش محاسبه بشه ، این مسیر و پاداش مجسابه شده در یک بافر ذخیره بشه تا الگوریتم GAN بتونه در دفعات بعد مسیر های بهتری رو تولید کنه