يمكن للشبكات العصبية والذكاء الاصطناعي المساعدة في حل المشكلات المعقدة ، لكن هذا لا يعني حتى الآن أنه يمكن أن يحل محل الشخص. دعونا نرى سبب عدم تمكنهم وأين يمكنهم المساعدة ، باستخدام مثال العديد من الخلايا العصبية.

رودال إي
منتصف الرحلة
Inpainting تجريبي
بالابوبا
نقطة

في عالم التكنولوجيا والروبوتات ، يُسمع أن الروبوتات في العقود الأخيرة كانت تؤدي مهامًا ، قبل ظهور الآلات الموصوفة ، كان يؤديها شخص فقط. في الوقت نفسه ، كما تظهر الممارسة ، فإن استخدام الروبوتات والذكاء الاصطناعي لا يجعل في كل حالة من الممكن تحقيق الجودة المطلوبة من الأداء مقارنة بالأشخاص. على خلفية ضجيج المعلومات حول ChatGPT والوسائل الأخرى للحصول على المعلومات في شكل نص ، قررت دراسة العديد من الشبكات العصبية التي تنشئ محتوى في شكل نصوص وصور.

رودال إي

الروسية DALL-E هي شبكة عصبية تنشئ صورًا بناءً على وصف نصي. ولكن في الواقع - شبكة عصبية يمكنها التعرف على الصور ، وكذلك أداء وظيفة البحث: أدخل النص واحصل على الصور. يعمل أيضًا بتعابير معقدة ، مثل "لماذا ضربه". ستعثر الشبكة العصبية على كلمة "ضرب" في النص وتعرضها في الصورة. يعمل مع الصور بتنسيق متجه فقط (bmp ، gif ، jpeg ، png) ، بينما لا يتجاوز الحجم 1 ميجا بايت. كطلب أول ، استخدمت كلمة "التحقق". يجب أن تولد الشبكة العصبية ما هو مكتوب في النص. هذا ما تقوله على الأقل في وثائقها ، لكن دعنا نرى كيف سيحدث لاحقًا. الآن ما زلت أعرف ما الذي يجب إدخاله بالضبط كاستعلام نصي. 

وبصراحة كانت النتيجة غير مشجعة.

خاصة عندما يكون هناك نوع من الضباب في الصور الإضافية الموصى بها. بشكل عام ، إذا لم تكن من محبي التواء كل ما يظهر أمام عينيك ، فهذه الشبكة العصبية ليست مناسبة لك. 

ومع ذلك ، باستخدام خوارزميات مختلفة ، تمكنت من الحصول على نتيجة يمكن أن تتطابق بشكل أو بآخر مع كلمة "اختبار". يمكنني إنشاء استعلام يصف بشكل كامل الإجراء في الصورة. باختيار الأشكال المختلفة ، استقررت على "اختبار الشبكة العصبية". 

اعتقدت أنني يجب أن أنهي ، لكن الطلب التالي "الصبي يقوم بواجبه المنزلي" جعلني أدرك أن هذه كانت البداية فقط.

حسنًا ، لقد قمت بسحب الطلب التالي بالكامل إلى عملية البحث ، والتي تبدو كالتالي:طابعة ثلاثية الأبعاد في الفضاء ".

نحن لا نتحدث عن صورة على غلاف إحدى المجلات ، لكن حقيقة أن الشبكة رسمت رسم تخطيطي لطابعة ثلاثية الأبعاد ووضعتها في الفضاء أسعدني في ذلك الوقت. اعتقدت أنها بداية جيدة ، لكن انتباهي تم تحويله بواسطة شبكة عصبية أكثر قوة.

منتصف الرحلة

أثناء اختبار الشبكة العصبية ruDALL-E ، تحدثت مع زوجتي ، التي اقترحت أن أقوم باختبار شبكة عصبية أخرى تسمى منتصف الرحلة. كان الأمر ممتعًا للغاية ، لكنه صعب للغاية.

مقارنةً بـ ruDall-E ، للوهلة الأولى ، تستخدم Mid flight خوارزميات أخرى ووظائف متقدمة. لا تعطي ruDALL-E نتائج على الفور ، لذلك قررت أن أجربها فيما بينها ومعرفة ما يمكن وما يمكن أن تفعله رحلة منتصف.

لقد استنفدتني عملية إعداد مساحة العمل. تعمل الشبكة العصبية عن طريق إدخال وإخراج المعلومات من خلال Discord.

كنت أعلم أن الشبكة العصبية تعمل باللغة الإنجليزية فقط ، لكن عملية إدخال الطلب لم تكن واضحة. لا يمكنك فقط كتابة النص عن طريق القياس بمحرك البحث.

وعندما اكتشفت أوامر إدخال المعلومات ، ما زلت أتعثر في جميع أنواع الأذونات والتأكيدات.

وأخيراً ، بدأت العملية.

خلقت الشبكة العصبية النتيجة الأولى.

تقدم الشبكة العصبية اختيار إحدى النتائج التي تم الحصول عليها من أجل مواصلة التوليد. تظهر النتيجة النهائية في الصورة التالية.

قارن الآن مع النتيجة التي تم الحصول عليها في الروسية DALL-E. مختلف بشكل ملحوظ ، أليس كذلك؟ لاختبار هذه الشبكة العصبية ، جربت العديد من الاستعلامات المتعلقة بالطباعة ثلاثية الأبعاد. فيما يلي أقدم أمثلة اقترحتها الشبكة العصبية لمكالمات مختلفة.

في انتظار الطباعة ثلاثية الأبعاد

طباعة مزرعة ثلاثية الأبعاد

طابعة سوبر ثلاثية الأبعاد

من المؤكد أن توليد التجريد أمر جيد ، لكن دعونا نجرب مهمة أكثر صعوبة.

دعنا نحاول إنشاء شعار لشركة تطور برنامجًا للطباعة ثلاثية الأبعاد. تبين أن الطلب الأول صعب للغاية بالنسبة لإدراك الشبكة العصبية وأعطى النتيجة التالية.

لذلك ، قررت تبسيط الطلب للحصول على شيء أكثر إثارة للاهتمام وغير قياسي. يجب تقديم أي طلب بطريقة مفهومة. لن ينجح الأمر في كتابة شيء من هذا القبيل.

قررت تطوير الخيار الرابع.

وبعد عدة خيارات للتطوير ، أعطتني الشبكة العصبية النسخة النهائية التالية.

من الصعب بالنسبة لي تقييم النتيجة ، لذلك أترك الأمر لتقديرك في التعليقات. أستطيع أن أقول على وجه اليقين أنني لن أستخدم هذا الشعار لنفسي. لقد لاحظت أنه عند استخدام تعريف الطباعة ثلاثية الأبعاد ، هناك دائمًا أشكال مختلفة من الجماجم. وليس هذا فقط. في مرحلة معينة من تطور الطباعة ثلاثية الأبعاد ، طبع العديد من الجماجم ، لذلك كانت الصورة متوقعة. دعنا نحاول إنشاء شعار للاستعلام "خدمة الطباعة ثلاثية الأبعاد عبر الإنترنت".

لم أتعمق في خوارزميات التوليد ، على الرغم من أن النتيجة تُظهر أنه من كلمة "الشعار" ، تستخرج الخلايا العصبية فكرة عامة عن الشعار. تخبرنا كل هذه المونوغرامات ولوحة الألوان عن النهج العام في فهم طريقة عرض الشعار. لا يعجبني هذا النمط ، لذا حاولت دمج شعارنا مع صورة من الإنترنت حول موضوع الطباعة ثلاثية الأبعاد بلون يعجبني.

نتيجة لذلك ، حصلنا على مفهوم مثير جدًا للاهتمام في رأيي.

ومع ذلك لا يوجد حل جاهز. مجرد مفهوم ، إذا لزم الأمر ، سيحتاج المصمم إلى الانتهاء منه في شكل شخص حقيقي.

في النهاية ، أدركت أنه في الاستعلامات المعقدة حول مواضيع ضيقة نسبيًا ، تدعم الشبكة العصبية فقط أبسط الاستعلامات. بالطبع ، يتزايد عدد هذه الطلبات ، وتتعلم الشبكة منها ، وتراكم المعرفة والخبرة على خلفية التفاعل مع أناس حقيقيين. على سبيل المثال ، هناك مثل هذا النهج لتدريب الشبكات العصبية ، وهو ما يسمى "التشبع" ، وهناك طريقة "للضغط". باستخدام "التشبع" ، يتم تدريب الشبكة العصبية على مجموعة كبيرة من أمثلة التدريب ، وعلى "الضغط" - على واحد فقط. حتى الآن ، هذا يشبه التواصل مع طفل يمكن تعليمه جيدًا وسيئًا. لكن ربما لن تكون قادرًا على تعلم أي شيء منه. من ناحية ، ليست هناك حاجة لاختراع أي شيء ، ومن ناحية أخرى ، حتى لو توصلت إلى شيء جديد ، فمن المحتمل أن يكون هذا قد تم اختراعه منذ وقت طويل. 

Inpainting تجريبي

Inpainting تجريبي هي شبكة عصبية تسمح لك بتعديل الصور من أجل إزالة بعض الأشياء أو الأشياء غير المرغوب فيها. يوجد عرض توضيحي للوظيفة في شكل معاينة في الصفحة الرئيسية للشبكة العصبية.

الخطوة الأولى هي تحديد صورة لتحريرها.

اخترت صورًا من تركيب جسمنا الفني على الحائط ، والذي كان مدعومًا بيد. لقد حددت لنفسي مهمة إزالة يدي من الصورة.

فعلت كل الخطوات حسب التعليمات.

لذلك لم تنجح. حاولت عدة مرات ، في النهاية لم تنجح النتيجة المرجوة. تعامل Pixelmator مع هذه المهمة على الفور.

في النهاية ، لم أفهم كيف أعمل معها. ربما يمكنك.

بالابوبا

بالابوبا هي شبكة عصبية تتيح لك إنشاء استمرار للنص بناءً على مدخلات الملخصات القصيرة ووصف موجز.

اعتقدت ، حسنًا ، على الأقل يجب ألا تكون هناك مشاكل في الاختبار. الآن سيقدم لي مجموعة من الاختلافات في النص ، بناءً على جمل قصيرة وملخصات ، لكن لم يكن هذا هو الحال. على الأرجح ، كانت توقعاتي بعد إنشاء الصور عالية جدًا.

في الوقت نفسه ، في حالة بلابوب ، تمكنت من كتابة بعض النقاط التي تملأ هذا النص. عند كتابة هذا النص ، استعنت بالعبوب. يمكنني تحديد اللحظة التي ساعدتني فيها الشبكة العصبية. هذه اللحظة هي اقتراح خيارات لاستمرار النص ، مما ساعدني على تذكر اللحظات والجوانب التي كنت على الأرجح قد نسيت أن أصفها إذا لم أعمل مع العصبون. ومع ذلك ، فإنه يفتقر إلى بنية النص أو تصحيح الأخطاء أو الوظائف الأخرى التي تُستخدم عادةً للتحرير. وإذا نسيت شيئًا ما ، يمكنني تذكره لاحقًا. لذلك ، فإن المساعدة الرئيسية في التسارع. وتسريع العمل أيضا جيد جدا!

بنفسي ، لقد حددت الخوارزمية التالية للتواصل مع Balabob. كتب النص بإيجاز ودقة. الخطوة الأولى هي طرح كل جملة بالتسلسل كبيانات أولية. أقوم على الفور بإضافة كلمة أو تعبير عن الموضوع إلى الجملة. نحن ننتظر النتائج. نحن ننظر ونختار ونضيف الخيارات المناسبة. بمجرد أن تصبح الفقرة جاهزة ، نقوم بتشغيلها بالكامل. نحن ننظر ونختار ونضيف الخيارات المناسبة. بمجرد أن يصبح النص جاهزًا ، نقوم بتشغيله بالكامل. الهيكلة.

عند الطلب

لقد كتبت المزيد عن الشبكة العصبية على موقع Studia3d.com في مدونتي.

أصدرت الشبكة

على الموقع ، يمكنك تنزيل نماذج ثلاثية الأبعاد للأشخاص ، والحيوانات ، والخضروات ، والفواكه ، والسيارات ، إلخ. كل هذا يمكنك تنزيله على جهاز الكمبيوتر الخاص بك واستخدامه في النموذج الخاص بك.

هكذا تعرف. ولكنها الحقيقة! على أي حال ، أحسنت =)

دعنا نقارن هذا بطريقي المعتاد في كتابة مقال: أطرح نصًا قصيرًا باستمرار وأطروحة. أبدأ في الكشف عن كل جملة وكلمة من أجل وصف ونقل ما يدور في ذهني قدر الإمكان. علاوة على ذلك ، أقوم بمعالجة كل شيء ظهر هيكليًا. كما ترى ، لا يوجد فرق عمليًا. تساعد الشبكة العصبية قليلاً على "عدم نسيان أي شيء". هذه هي ميزتها الرئيسية.

بدت تجربة كتابة النص باستخدام شبكة عصبية جديدة بالنسبة لي. على الرغم من أن الخوارزمية هي نفسها تقريبًا. لكن سرعة كتابة النص بشبكة عصبية أعلى وكان العمل أكثر إنتاجية ، لأن عملية "كشف" الجزء الوصفي من النص تكون أسرع. على الرغم من أنه لا يزال يتعين تولي بنية النص وعملية نقل جوهر المقالة ، بل وأحيانًا الإملاء ، لأن مثل هذه الوظائف جلافريد، بالابوبا لا. يساعد Glavred ، إذا كان أي شخص لا يعرف ، في مسح نص القمامة اللفظية والتحقق من الامتثال لأسلوب المعلومات.

النص الذي اقترحته العصبون:

في عالم التكنولوجيا والروبوتات ، في كثير من الأحيان ، يمكنك سماع أن الروبوتات يمكنها الآن أداء المهام التي كانت ممكنة في السابق للبشر فقط. في الوقت نفسه ، كما تظهر الممارسة ، فإن استخدام الروبوتات والذكاء الاصطناعي لا يسمح دائمًا بتحقيق جودة أداء أعلى مما فعل الناس.

تصنيف Glavred 5 من أصل 10.

تم تصحيح النص بواسطتي:

في عالم التكنولوجيا والروبوتات ، يُسمع أن الروبوتات في العقود الأخيرة كانت تؤدي مهامًا كان يؤديها شخص فقط قبل ظهور الآلات الموصوفة. في الوقت نفسه ، كما تبين الممارسة ، فإن استخدام الروبوتات والذكاء الاصطناعي لا يحقق في كل حالة الجودة المطلوبة للأداء مقارنة بالأشخاص.

تصنيف Glavred 10 من أصل 10.

لكن على أي حال ، أحببته. يشبه الأمر مع طفل: ربما لن تتمكن من تعلم شيء منه. على الرغم من أنه بشكل عام ، يمكن للطفل أن يساعد في شيء ما. على الأقل ليس مملاً. إنه لأمر رائع أن يكون هناك مثل هذا التوسع في الإيجابية.

نقطة

من المثير للاهتمام العثور على الخلايا العصبية لتوليد نماذج ثلاثية الأبعاد. الصورة جيدة بالطبع ، لكن لا يمكن طباعة الصورة إلا على طابعة عادية. بالنسبة للطابعة ثلاثية الأبعاد ، يجب أن يكون النموذج ثلاثي الأبعاد ، ويتكون من مضلعات ، وليس وحدات بكسل ، ويتوافق معها متطلبات.

عند الطلب في شريط البحث ، وجدت نفس الشيء نقطة.

دعونا نجرب كيف يعمل. أدخل الاستعلام "طابعة ثلاثية الأبعاد صغيرة".

وحصلت على صندوق. مثير للاهتمام. دعنا ندخل استعلامًا أبسط "طابعة ثلاثية الأبعاد".

لا أفهم. لا افهم شيئا. يبدو أنه من المبكر جدا. وكم سيكون لطيفًا أن نمنح عملائنا الفرصة لإنشاء نماذج ثلاثية الأبعاد ببساطة من وصف نصي. يبدو أنه من المبكر جدا.

إنتاج

هذا العام ، يمكن استخدام الشبكات العصبية كإضافة للخدمات الحالية. خير مثال على ذلك هو GTranslate ، وهي خدمة ترجمة آلية لموقع الويب.

GTranslate هو مترجم مواقع ويب يمكنه تلقائيًا ترجمة أي موقع ويب إلى أي لغة وإتاحته للعالم بأسره!

من ميزات هذه الخدمة اختيار الترجمات وفقًا لموضوع الموقع.

حتى الآن ، لا يمكن للخلايا العصبية الموجودة ، بكل جمال الإطارات والألوان الزاهية ، أن تحل محل الفنانين والمصورين والأطر المماثلة. وظائف ضعيفة ، جودة ضعيفة نوعًا ما ، منطق ضعيف نوعًا ما ونظام تفاعل معقد للغاية. وقت استجابة جيد ، ولكن ليس من الواضح ما هو الوقت الذي سيتم فيه إنشاء شيء مقبول. حتى الآن ، هذا مثير للاهتمام فقط في حالة الصور غير المجدية المطلوبة فقط لملء بعض المساحة الفارغة بشيء ملون. على الرغم من أنه من الأفضل استخدام التجريد لهذا الغرض.