!शुभ शरुआत स्टार्ट पे के साथ!
Large Language Models (LLMs) have been making waves in the tech world, demonstrating remarkable capabilities such as generating text of human-like quality, translating languages, and producing diverse creative content. However, it is crucial to understand the nature of these models and their underlying mechanisms. In this course, we will define Large Language Models (LLMs), describe their use cases, and explore various applications, task types, and projects related to LLMs. |
बड़े भाषा मॉडल (एलएलएम) तकनीक की दुनिया में लहरें बना रहे हैं, मानव जैसी गुणवत्ता के पाठ को उत्पन्न करने, भाषाओं का अनुवाद करने और विविध रचनात्मक सामग्री का उत्पादन करने जैसी उल्लेखनीय क्षमताओं का प्रदर्शन कर रहे हैं। हालांकि, इन मॉडलों की प्रकृति और उनके अंतर्निहित तंत्र को समझना महत्वपूर्ण है। इस कोर्स में, हम बड़े भाषा मॉडल (एलएलएम) को परिभाषित करेंगे, उनके उपयोग के मामलों का वर्णन करेंगे, और एलएलएम से संबंधित विभिन्न अनुप्रयोगों, कार्य प्रकारों और परियोजनाओं का पता लगाएंगे। |
What are LLMs? 3 Kinds of Large Language Models Benefits of Using LLMs How Are Large Language Models Trained? How Do Large Language Models Work? Sample LLMs Use Case Challenges & Limitations of LLMs LLM Task Types in LLM Projects Glossary Summary |
एलएलएम क्या हैं?
|
Generative AI is like a creative side of deep learning. It makes new stuff—text, images, audio, video—by learning from what already exists. Large language models refer to large, general-purpose language models that can be pre-trained and then fine-tuned for specific tasks. Pre-trained Large Language Models (LLMs) undergo an initial training phase where they learn a comprehensive understanding of language by analyzing diverse internet text. This phase means they get a broad grasp of general language patterns and contextual nuances. Fine-tuning involves subjecting these pre-trained LLMs to a specialized training regimen tailored to refine their ability in specific domains or tasks, such as medicine or gaming. Pre-training establishes the foundational linguistic knowledge, while fine-tuning tailors the model to excel in targeted applications, leveraging the acquired general expertise |
जनरेटिव AI डीप लर्निंग के रचनात्मक पक्ष की तरह है। यह पहले से मौजूद चीज़ों से सीखकर नई चीज़ें बनाता है - टेक्स्ट, इमेज, ऑडियो, वीडियो। लार्ज लैंग्वेज मॉडल बड़े, सामान्य-उद्देश्य वाले भाषा मॉडल को संदर्भित करते हैं जिन्हें पहले से प्रशिक्षित किया जा सकता है और फिर विशिष्ट कार्यों के लिए ठीक किया जा सकता है। पूर्व-प्रशिक्षित लार्ज लैंग्वेज मॉडल (LLM) एक प्रारंभिक प्रशिक्षण चरण से गुजरते हैं जहाँ वे विविध इंटरनेट टेक्स्ट का विश्लेषण करके भाषा की व्यापक समझ सीखते हैं। इस चरण का मतलब है कि उन्हें सामान्य भाषा पैटर्न और संदर्भगत बारीकियों की व्यापक समझ मिलती है। फाइन-ट्यूनिंग में इन पूर्व-प्रशिक्षित LLM को विशिष्ट डोमेन या कार्यों, जैसे कि चिकित्सा या गेमिंग में उनकी क्षमता को निखारने के लिए तैयार किए गए विशेष प्रशिक्षण व्यवस्था के अधीन करना शामिल है। पूर्व-प्रशिक्षण आधारभूत भाषाई ज्ञान स्थापित करता है, जबकि फाइन-ट्यूनिंग मॉडल को लक्षित अनुप्रयोगों में उत्कृष्टता प्राप्त करने के लिए तैयार करता है, जिससे अर्जित सामान्य विशेषज्ञता का लाभ मिलता है |
3 Kinds of Large Language Models These are the three kinds of Large Language Models and each needs prompting in a different way. Generic Language Model predicts the next word based on the language in the training data. This is an example of a generic language model - The next word is a 'token' based on the language in the training data (a token is A unit of text, often a word or subword, processed by the model) Example: the cat sat on — Instruction tuned model is trained to predict a response to the instructions given in the input. Example: summarize a text of “x”, generate a poem in the style of ‘x”, give me a list of keywords based on semantic similarity for “x”. And in this example, classify the text into neutral, negative or positive. Dialog tuned model is trained to have a dialog by the next response. Dialog-tuned models are a special case of instruction tuned where requests are typically framed as questions to a chat bot. Dialog tuning is expected to be in the context of a longer back and forth conversation, and typically works better with natural question-like phrasings. |
3 प्रकार के बड़े भाषा मॉडल ये तीन प्रकार के बड़े भाषा मॉडल हैं और प्रत्येक को अलग-अलग तरीके से संकेत देने की आवश्यकता होती है। जेनेरिक भाषा मॉडल प्रशिक्षण डेटा में भाषा के आधार पर अगले शब्द की भविष्यवाणी करता है। यह एक जेनेरिक भाषा मॉडल का एक उदाहरण है - अगला शब्द प्रशिक्षण डेटा में भाषा के आधार पर एक 'टोकन' है (टोकन पाठ की एक इकाई है, अक्सर एक शब्द या उपशब्द, जिसे मॉडल द्वारा संसाधित किया जाता है) उदाहरण: बिल्ली बैठ गई - - अगला शब्द "द" होना चाहिए और आप देख सकते हैं कि "द" सबसे संभावित अगला शब्द है। इस प्रकार को खोज में "ऑटो-कम्प्लीट" के रूप में सोचें। निर्देश ट्यून्ड मॉडल को इनपुट में दिए गए निर्देशों के प्रति प्रतिक्रिया की भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है। उदाहरण: "x" के टेक्स्ट को सारांशित करें, 'x' की शैली में एक कविता बनाएँ, मुझे "x" के लिए अर्थगत समानता के आधार पर कीवर्ड की एक सूची दें। और इस उदाहरण में, टेक्स्ट को तटस्थ, नकारात्मक या सकारात्मक में वर्गीकृत करें। डायलॉग ट्यून्ड मॉडल को अगले रिस्पॉन्स द्वारा डायलॉग करने के लिए प्रशिक्षित किया जाता है। डायलॉग-ट्यून्ड मॉडल इंस्ट्रक्शन ट्यून्ड का एक विशेष मामला है जहाँ अनुरोधों को आम तौर पर चैट बॉट के लिए प्रश्नों के रूप में तैयार किया जाता है। डायलॉग ट्यूनिंग को एक लंबी आगे-पीछे की बातचीत के संदर्भ में होने की उम्मीद है, और आम तौर पर प्राकृतिक प्रश्न-जैसे वाक्यांशों के साथ बेहतर काम करता है। |
Benefits of Using LLMs 1. A single model can be used for different tasks 2. The fine-tune process requires minimal field data. In machine learning, “few-shot” refers to training a model with minimal data and “zero-shot” implies that a model can recognize things that have not explicitly been taught in the training before. 3. The performance is continuously growing with more data and parameters. |
एलएलएम का उपयोग करने के लाभ 1. एक ही मॉडल का उपयोग विभिन्न कार्यों के लिए किया जा सकता है 2. फ़ाइन-ट्यून प्रक्रिया के लिए न्यूनतम फ़ील्ड डेटा की आवश्यकता होती है। मशीन लर्निंग में, "कुछ-शॉट" न्यूनतम डेटा के साथ एक मॉडल को प्रशिक्षित करने को संदर्भित करता है और "शून्य-शॉट" का अर्थ है कि एक मॉडल उन चीजों को पहचान सकता है जिन्हें पहले प्रशिक्षण में स्पष्ट रूप से नहीं सिखाया गया है। 3. अधिक डेटा और पैरामीटर के साथ प्रदर्शन लगातार बढ़ रहा है। |
How Are Large Language Models Trained? Most LLMs are pre-trained on a large, general-purpose dataset. The purpose of pre-training is for the model to learn high-level features that can be transferred to the fine-tuning stage for specific tasks. The training process of a large language model involves: Pre-processing the text data to convert it into a numerical representation that can be fed into the model. |
बड़े भाषा मॉडल कैसे प्रशिक्षित किए जाते हैं? अधिकांश LLM को बड़े, सामान्य-उद्देश्य वाले डेटासेट पर पूर्व-प्रशिक्षित किया जाता है। पूर्व-प्रशिक्षण का उद्देश्य मॉडल को उच्च-स्तरीय सुविधाएँ सीखना है जिन्हें विशिष्ट कार्यों के लिए फ़ाइन-ट्यूनिंग चरण में स्थानांतरित किया जा सकता है। बड़े भाषा मॉडल की प्रशिक्षण प्रक्रिया में शामिल हैं: पाठ डेटा को पूर्व-प्रसंस्करण करके उसे संख्यात्मक निरूपण में बदलना जिसे मॉडल में फीड किया जा सके। मॉडल के मापदंडों को बेतरतीब ढंग से असाइन करना। पाठ डेटा के संख्यात्मक निरूपण को मॉडल में फीड करना। मॉडल के आउटपुट और वाक्य में वास्तविक अगले शब्द के बीच अंतर को मापने के लिए हानि फ़ंक्शन का उपयोग करना। हानि को कम करने के लिए मॉडल के मापदंडों को अनुकूलित करना। प्रक्रिया को तब तक दोहराना जब तक मॉडल के आउटपुट सटीकता के स्वीकार्य स्तर तक नहीं पहुँच जाते। |
How Do Large Language Models Work?
Think of a large language model like a super-smart text generator. It learns from tons of examples and uses deep neural networks to come up with stuff. This model is based on something called a transformer, which is like its brain. Unlike other systems that use a loop to understand how words relate in a sentence, this one uses self-attention. It's like the model figures out which words are the VIPs in a sentence and pays extra attention to them. Basically, it calculates a fancy weighted sum to decide which words are the most important and connected to each other. It does this by giving each word a score, kind of like saying how crucial it is compared to the others in the sentence. |
बड़े भाषा मॉडल कैसे काम करते हैं? बड़े भाषा मॉडल को सुपर-स्मार्ट टेक्स्ट जनरेटर की तरह समझें। यह ढेरों उदाहरणों से सीखता है और चीज़ों को बनाने के लिए गहरे तंत्रिका नेटवर्क का उपयोग करता है। यह मॉडल ट्रांसफॉर्मर नामक किसी चीज़ पर आधारित है, जो इसके मस्तिष्क की तरह है। अन्य सिस्टम के विपरीत जो वाक्य में शब्दों के संबंध को समझने के लिए लूप का उपयोग करते हैं, यह मॉडल आत्म-ध्यान का उपयोग करता है। यह ऐसा है जैसे मॉडल यह पता लगाता है कि वाक्य में कौन से शब्द VIP हैं और उन पर अतिरिक्त ध्यान देता है। मूल रूप से, यह यह तय करने के लिए एक फैंसी भारित राशि की गणना करता है कि कौन से शब्द सबसे महत्वपूर्ण हैं और एक दूसरे से जुड़े हुए हैं। यह प्रत्येक शब्द को एक स्कोर देकर ऐसा करता है, जैसे यह कहना कि वाक्य में अन्य की तुलना में यह कितना महत्वपूर्ण है। |
Sample LLMs Use Case What is Question Answering (QA) in Natural Language Processing (NLP)? Question answering (QA) is a subfield of natural language processing that deals with the task of automatically answering questions posed in natural language. QA systems are typically trained on a large amount of text and code, and they are able to answer a wide range of questions, including: factual
|
नमूना एलएलएम उपयोग मामला प्राकृतिक भाषा प्रसंस्करण (एनएलपी) में प्रश्न उत्तर (क्यूए) क्या है? प्रश्न उत्तर (क्यूए) प्राकृतिक भाषा प्रसंस्करण का एक उपक्षेत्र है जो प्राकृतिक भाषा में पूछे गए प्रश्नों का स्वचालित रूप से उत्तर देने के कार्य से संबंधित है। क्यूए सिस्टम आमतौर पर बड़ी मात्रा में टेक्स्ट और कोड पर प्रशिक्षित होते हैं, और वे कई तरह के सवालों का जवाब देने में सक्षम होते हैं, जिनमें शामिल हैं: तथ्यात्मक यहाँ मुख्य बात यह है कि इन प्रश्न उत्तर मॉडल को विकसित करने के लिए आपको डोमेन ज्ञान की आवश्यकता है। |
Below are example questions given to Large Language Model chatbots. 1 2 3 In each of the questions, a desired response was obtained. This is due to Prompt Design |
नीचे लार्ज लैंग्वेज मॉडल चैटबॉट को दिए गए उदाहरण प्रश्न दिए गए हैं। 1 2 3 प्रत्येक प्रश्न में, एक वांछित प्रतिक्रिया प्राप्त हुई। यह प्रॉम्प्ट डिज़ाइन के कारण है |
What is Prompt Design & Prompt Engineering? Both involve the process of creating a prompt that is clear, concise, and informative. However, there are some key differences between the two.
In general, prompt design is a more general concept, while prompt engineering is a more specialized concept. Prompt design is essential, while prompt engineering is only necessary for systems that require a high degree of accuracy or performance. |
प्रॉम्प्ट डिज़ाइन और प्रॉम्प्ट इंजीनियरिंग क्या है? दोनों में एक प्रॉम्प्ट बनाने की प्रक्रिया शामिल है जो स्पष्ट, संक्षिप्त और जानकारीपूर्ण है। हालाँकि, दोनों के बीच कुछ मुख्य अंतर हैं। प्रॉम्प्ट डिज़ाइन प्रॉम्प्ट इंजीनियरिंग सामान्य तौर पर, प्रॉम्प्ट डिज़ाइन एक अधिक सामान्य अवधारणा है, जबकि प्रॉम्प्ट इंजीनियरिंग एक अधिक विशिष्ट अवधारणा है। प्रॉम्प्ट डिज़ाइन आवश्यक है, जबकि प्रॉम्प्ट इंजीनियरिंग केवल उन प्रणालियों के लिए आवश्यक है जिन्हें उच्च स्तर की सटीकता या प्रदर्शन की आवश्यकता होती है। |
Challenges & Limitations of LLMs
Despite their impressive capabilities, LLMs still face some challenges:
This is why it is important we continue to train LLMs to ensure they are honest, harmless, helpful, and usable via our LLM Projects.
|
एलएलएम की चुनौतियाँ और सीमाएँ पूर्वाग्रह: एलएलएम को ऐसे डेटा पर प्रशिक्षित किया जाता है जो वास्तविक दुनिया के पूर्वाग्रहों को दर्शाता है। इससे पक्षपातपूर्ण आउटपुट हो सकते हैं, खासकर जब संवेदनशील विषयों से निपटना हो। पूर्वाग्रह खुद को किसी दिए गए तथ्य के रूप में एक राय या व्यक्तिपरक उत्तर बताने के रूप में प्रस्तुत कर सकता है। उदाहरण के लिए, निम्नलिखित उत्तर पूर्वाग्रह दर्शाता है: प्रॉम्प्ट: यूरोप में सबसे अच्छी राजधानी कौन सी है? खराब प्रतिक्रिया: यूरोप में सबसे अच्छी राजधानी पेरिस है। उत्तर में कोई तर्क या वस्तुनिष्ठता नहीं है। पूर्वाग्रह खुद को लिंग, जाति, वर्ग आदि रूढ़ियों को एक मानदंड के रूप में उपयोग करने के रूप में प्रस्तुत कर सकता है। उदाहरण के लिए, निम्न उत्तर पक्षपात दर्शाता है: प्रॉम्प्ट: "कौन से व्यक्तिगत गुण एक अच्छे प्रधानमंत्री को बनाते हैं? बुरा जवाब: एक अच्छे प्रधानमंत्री के पास उत्कृष्ट नेतृत्व कौशल होना चाहिए। राष्ट्र को प्रभावी ढंग से मार्गदर्शन करने के लिए उसे मजबूत नेतृत्व गुणों की आवश्यकता होती है। उसे कठिन निर्णय लेने, आत्मविश्वास जगाने और भविष्य के लिए एक स्पष्ट दृष्टिकोण निर्धारित करने में सक्षम होना चाहिए। यह जवाब लैंगिक पक्षपात दर्शाता है क्योंकि यह मानता है कि एक प्रधानमंत्री को पुरुष होना चाहिए और उन गुणों को संदर्भित करता है जिनकी 'उसे' आवश्यकता होगी। व्याख्यात्मकता: यह समझना मुश्किल हो सकता है कि एलएलएम अपने आउटपुट पर कैसे पहुंचते हैं, जिससे उनकी विश्वसनीयता और भरोसेमंदता का आकलन करना चुनौतीपूर्ण हो जाता है। प्रॉम्प्ट: "यदि जॉर्ज के पास $10 हैं और वह CVS में $3.21 और फिर वॉलमार्ट में $2.89 खर्च करता है, तो उसके पास कितना पैसा बचता है?" बुरा जवाब: जॉर्ज के पास $3.90 बचे हैं। यह एक खराब जवाब है। यह स्पष्ट नहीं करता है कि एलएलएम अपने निष्कर्ष पर कैसे पहुंचा। एक बेहतर जवाब होगा: अच्छा जवाब: यह पता लगाना कि $3.21 खर्च करने के बाद जॉर्ज के पास कितना पैसा बचा है CVS में और वॉलमार्ट में $2.89, आप उसके पास मौजूद शुरुआती राशि से खर्च की गई कुल राशि घटा सकते हैं। शुरुआती राशि = $10 CVS में खर्च की गई राशि = $3.21 वॉलमार्ट में खर्च की गई राशि = $2.89 |
LLM Task Types in LLM Projects On one thing that is important is that we provide genuine and authentic human content and interaction. Let's look at just some of the type of tasks you may be asked to complete in an LLM Project. Prompt Authoring You may be asked to create the following type of prompts. Different clients may approach these types of prompts differently, or have different definitions. This is why it is very important that when you take part in a project you fully review the instructions and information for that specific project, at first glance they may seem familiar to your understanding of prompt authoring but there may be nuances. |
एलएलएम परियोजनाओं में एलएलएम कार्य प्रकार एक बात जो महत्वपूर्ण है वह यह है कि हम वास्तविक और प्रामाणिक मानवीय सामग्री और इंटरेक्शन प्रदान करते हैं। आइए कुछ ऐसे कार्यों पर नज़र डालें जिन्हें आपको एलएलएम परियोजना में पूरा करने के लिए कहा जा सकता है। प्रॉम्प्ट ऑथरिंग आपको निम्न प्रकार के प्रॉम्प्ट बनाने के लिए कहा जा सकता है। अलग-अलग क्लाइंट इन प्रकार के प्रॉम्प्ट को अलग-अलग तरीके से देख सकते हैं, या उनकी अलग-अलग परिभाषाएँ हो सकती हैं। यही कारण है कि यह बहुत महत्वपूर्ण है कि जब आप किसी परियोजना में भाग लेते हैं तो आप उस विशिष्ट परियोजना के लिए निर्देशों और जानकारी की पूरी तरह से समीक्षा करें, पहली नज़र में वे प्रॉम्प्ट ऑथरिंग की आपकी समझ से परिचित लग सकते हैं लेकिन इसमें बारीकियाँ हो सकती हैं। |
Generate Examples: "Write me a story about a lost kitten." |
उत्पन्न करें उदाहरण: "मुझे एक खोई हुई बिल्ली के बच्चे के बारे में एक कहानी लिखें।" "न्यूयॉर्क की एक महिला सू के बारे में एक लिमरिक लिखें।" "एक ईमेल लिखें जिसमें मैं अपने दोस्त की शादी में शामिल न हो पाने के लिए माफ़ी मांगूँ।" |
Brainstorming Examples: "Brainstorm different ways I can style a simple black dress for different occasions" Chain of thought Examples: " If Bob is in the most famous park in New York and looking at a sculpture of a girl sat on a mushroom, what is the rabbit holding in its hand?" (A suitable answer would be: if Bob is in the most famous park in New York he is most likely to be in Central Park. In Central Park he is looking at the Alice in Wonderland sculpture which shows Alice sitting on top of a mushroom. Next to her are other characters including the rabbit. The rabbit is holding a pocket watch in its hand.") "Jennifer is in the Louvre, Paris. She is looking at most famous painting in the gallery. It makes her think about the artist. When did the artist die?" "Jane has $10.25. She buys some sweets for $3.25 and gives half of her remaining money to her best friend Sarah. How much money has Jane given Sarah?" QA The QA category can be open or closed ended. Different approaches and clients may have differing definitions of open and closed Q&As. Here is the definition we are using in this module: Open-ended QA: The question cannot be answered with information in the prompt. There may be a definitive answer (such as a given fact) or require the LLM freedom to answer with a detailed and unrestricted response. Closed-ended QA: The question must be answered with information in the prompt alone.
[Open ended] "What is the capital of Australia?" |
विचार-मंथन उदाहरण: "विभिन्न अवसरों के लिए एक साधारण काली पोशाक को स्टाइल करने के विभिन्न तरीकों पर विचार करें" "क्या आप विभिन्न होममेड उपहारों पर विचार कर सकते हैं जो मैं अपनी दादी के लिए बना सकता हूँ?" विचारों की श्रृंखला उदाहरण: "यदि बॉब न्यूयॉर्क के सबसे प्रसिद्ध पार्क में है और एक मशरूम पर बैठी लड़की की मूर्ति को देख रहा है, तो खरगोश अपने हाथ में क्या पकड़े हुए है?" (एक उपयुक्त उत्तर होगा: यदि बॉब न्यूयॉर्क के सबसे प्रसिद्ध पार्क में है, तो वह संभवतः सेंट्रल पार्क में होगा। सेंट्रल पार्क में वह एलिस इन वंडरलैंड की मूर्ति को देख रहा है, जिसमें एलिस को मशरूम के ऊपर बैठे हुए दिखाया गया है। उसके बगल में खरगोश सहित अन्य पात्र हैं। खरगोश अपने हाथ में एक पॉकेट घड़ी पकड़े हुए है।) "जेनिफर पेरिस के लौवर में है। वह गैलरी में सबसे प्रसिद्ध पेंटिंग को देख रही है। यह उसे कलाकार के बारे में सोचने पर मजबूर करता है। कलाकार की मृत्यु कब हुई?" "जेन के पास $10.25 हैं। वह $3.25 में कुछ मिठाइयाँ खरीदती है और अपने बचे हुए पैसे का आधा हिस्सा अपनी सबसे अच्छी दोस्त सारा को देती है। जेन ने सारा को कितने पैसे दिए हैं?" (एक उपयुक्त उत्तर होगा: "जेन $10.25 से शुरू करती है और $3.25 की मिठाई खरीदती है। $10.25-$3.25 = $7. वह $7 का आधा हिस्सा सारा को देती है। $7/2 = $3.50. सारा के पास $3.50 हैं।") प्रश्न: जॉन के पास $50 हैं। जॉन CVS जाता है और $14.70 खर्च करता है। फिर वह वॉलमार्ट जाता है और $22 खर्च करता है। जॉन के पास कितने पैसे बचे हैं?" प्रश्नोत्तर दिए गए विषय पर जानकारी के लिए एक सीधा प्रश्न। प्रश्नोत्तर श्रेणी खुली या बंद हो सकती है। अलग-अलग दृष्टिकोण और क्लाइंट के पास खुले और बंद प्रश्नोत्तर की अलग-अलग परिभाषाएँ हो सकती हैं। यहाँ वह परिभाषा है जिसका हम इस मॉड्यूल में उपयोग कर रहे हैं: प्रश्नोत्तर: प्रॉम्प्ट में दी गई जानकारी के साथ प्रश्न का उत्तर नहीं दिया जा सकता है। एक निश्चित उत्तर हो सकता है (जैसे कि कोई दिया गया तथ्य) या विस्तृत और अप्रतिबंधित प्रतिक्रिया के साथ उत्तर देने के लिए LLM स्वतंत्रता की आवश्यकता हो सकती है। बंद-अंत प्रश्नोत्तर: प्रश्न का उत्तर केवल प्रॉम्प्ट में दी गई जानकारी से दिया जाना चाहिए। उदाहरण [खुला अंत] "ऑस्ट्रेलिया की राजधानी क्या है?" |
Classification Example "Is this review negative? I had the chicken tikka masala as my main course and it was very salty and fatty. Disappointed. Wouldn't order again." "Sort the following fruits into two categories: citrus fruits and non-citrus fruits: lemon, apricot, lime, apple, plum, grapefruit, kiwi, orange, grapes" Rewrite Examples "Rewrite the following passage in the style of Charles Dickens: "Please paraphrase this: |
वर्गीकरण उदाहरण "क्या यह समीक्षा नकारात्मक है? मैंने अपने मुख्य पाठ्यक्रम के रूप में चिकन टिक्का मसाला खाया था और यह बहुत नमकीन और वसायुक्त था। निराश। फिर से ऑर्डर नहीं करूंगा।" "निम्नलिखित फलों को दो श्रेणियों में बाँटें: खट्टे फल और गैर-खट्टे फल: नींबू, खुबानी, नींबू, सेब, बेर, अंगूर, कीवी, संतरा, अंगूर" पुनर्लेखन उदाहरण "चार्ल्स डिकेंस की शैली में निम्नलिखित अंश को फिर से लिखें: "कृपया इसे संक्षेप में लिखें: |
Extract Example "Extract the key features of the Sharp 40FDK television Summarize Example "Summarize this text into two sentences" Translate Examples "Translate 'where is the pool?' into Dutch" Code Examples "Write me a Python function to show if a given number is odd or even" Conversation In this format, you will present a conversation that ends with the expectation that the LLM will continue the conversation.
"Agent: How can I help you today? John: I want to book a flight to Malaga. Agent. Okay. What date would you like to travel? John: 10th May 2024 but I can be flexible |
एक्सट्रैक्ट "शार्प 40FDK टेलीविज़न की मुख्य विशेषताओं को समझें सारांशित करें उदाहरण "इस पाठ को दो वाक्यों में सारांशित करें" कोड उदाहरण "मुझे यह दिखाने के लिए एक पायथन फ़ंक्शन लिखें कि दी गई संख्या विषम है या सम" बातचीत इस प्रारूप में, आप एक बातचीत प्रस्तुत करेंगे जो इस उम्मीद के साथ समाप्त होगी कि LLM बातचीत जारी रखेगा। उदाहरण "एजेंट: मैं आज आपकी कैसे मदद कर सकता हूँ? जॉन: मैं मालागा के लिए एक उड़ान बुक करना चाहता हूँ। एजेंट। ठीक है। आप किस तारीख को यात्रा करना चाहेंगे? जॉन: 10 मई 2024 लेकिन मैं लचीला हो सकता हूँ |
Creating Complete Conversations Some tasks may ask the user to act as both human and 'chatbot'. This is to create conversations from scratch where the user writes the prompt/question and then writes what would be a desirable answer. In this type of task, the challenge is to be able to think like a user (not as yourself) and write the type of prompt they would and also write helpful, honest, and harmless answers as the chatbot, that the user will be happy and satisfied with. These types of tasks are particularly useful to train and challenge models on specialist domains/topics. They are also useful to train models for a specific locale. For example, the user is asked to write a prompt for the en_GB perspective (that is in English as spoken in Great Britain Prompt: What colour was Gwyneth Paltrow's gown when she won the Oscar for Shakespeare in Love? Poor response: Gwyneth Paltrow won the Academy Award for Best Actress for her role in "Shakespeare in Love" at the 71st Academy Awards in 1999. At that ceremony, she wore a pale pink gown designed by Ralph Lauren. The dress became notable not just for its color but also for its elegant and simple design, making it a memorable part of her Oscar-winning appearance. This is a poor response as although the information is correct note how, in the second sentence the 'chatbot' uses the en_US American spelling 'color'. An en_GB user would expect to see en_GB spelling, 'colour'. Creating Complex and Domain Specific Prompts LLMs have become very good at answer basic prompts, for example, what is the capital of Spain? To take LLMs to the next level, many projects require prompts and answers that demonstrate complexity. Complexity can refer to two distinct things:
Some tasks may require people with specific domain (topic) knowledge to create in-depth and specialised prompts and answers in such domains as:
|
संपूर्ण वार्तालाप बनाना कुछ कार्य उपयोगकर्ता को मानव और 'चैटबॉट' दोनों के रूप में कार्य करने के लिए कह सकते हैं। यह स्क्रैच से वार्तालाप बनाना है जहाँ उपयोगकर्ता प्रॉम्प्ट/प्रश्न लिखता है और फिर लिखता है कि एक वांछनीय उत्तर क्या होगा। इस प्रकार के कार्य में, चुनौती यह है कि उपयोगकर्ता की तरह सोचने में सक्षम होना (अपने आप की तरह नहीं) और उस प्रकार का प्रॉम्प्ट लिखना जो वे लिखेंगे और चैटबॉट के रूप में सहायक, ईमानदार और हानिरहित उत्तर भी लिखें, जिससे उपयोगकर्ता खुश और संतुष्ट हो। इस प्रकार के कार्य विशेष रूप से विशेषज्ञ डोमेन/विषयों पर मॉडल को प्रशिक्षित करने और चुनौती देने के लिए उपयोगी होते हैं। वे किसी विशिष्ट लोकेल के लिए मॉडल को प्रशिक्षित करने के लिए भी उपयोगी होते हैं। उदाहरण के लिए, उपयोगकर्ता को en_GB परिप्रेक्ष्य के लिए एक संकेत लिखने के लिए कहा जाता है (जो कि ग्रेट ब्रिटेन में बोली जाने वाली अंग्रेजी में है संकेत: ग्वेनेथ पाल्ट्रो ने शेक्सपियर इन लव के लिए ऑस्कर जीतने पर किस रंग का गाउन पहना था? खराब प्रतिक्रिया: ग्वेनेथ पाल्ट्रो ने 1999 में 71वें अकादमी पुरस्कार में "शेक्सपियर इन लव" में अपनी भूमिका के लिए सर्वश्रेष्ठ अभिनेत्री का अकादमी पुरस्कार जीता। उस समारोह में, उन्होंने राल्फ लॉरेन द्वारा डिज़ाइन किया गया एक हल्का गुलाबी गाउन पहना था। यह पोशाक न केवल अपने रंग के लिए बल्कि अपने सुरुचिपूर्ण और सरल डिज़ाइन के लिए भी उल्लेखनीय बन गई, जिसने इसे उनके ऑस्कर विजेता प्रदर्शन का एक यादगार हिस्सा बना दिया। यह एक खराब प्रतिक्रिया है क्योंकि हालाँकि जानकारी सही है, लेकिन ध्यान दें कि दूसरे वाक्य में 'चैटबॉट' en_US अमेरिकी वर्तनी 'रंग' का उपयोग करता है। एक en_GB उपयोगकर्ता en_GB वर्तनी, 'रंग' देखने की अपेक्षा करेगा। जटिल और डोमेन विशिष्ट संकेत बनाना LLM बुनियादी संकेतों का उत्तर देने में बहुत अच्छे हो गए हैं, उदाहरण के लिए, क्या स्पेन की राजधानी कौन सी है? LLM को अगले स्तर पर ले जाने के लिए, कई परियोजनाओं में ऐसे संकेत और उत्तरों की आवश्यकता होती है जो जटिलता को प्रदर्शित करते हैं। जटिलता दो अलग-अलग चीजों को संदर्भित कर सकती है: एक जटिल प्रश्न विषय के संदर्भ में एक बहुत ही कठिन प्रश्न है। एक जटिल प्रश्न इस कारण से जटिल है कि इसे कैसे लिखा गया है। यह सीधा-सादा नहीं हो सकता है या इसमें कई पैरामीटर हो सकते हैं जिनका उत्तर पालन करना चाहिए, उदाहरण के लिए, "मुझे शादी की मेज की सेटिंग के लिए विचार चाहिए लेकिन उनमें असली फूल शामिल नहीं होने चाहिए (दूल्हे को एलर्जी है) और नारंगी और पीले रंग शामिल होने चाहिए। कृपया सूची प्रारूप में 3 विचार प्रदान करें"। कुछ कार्यों के लिए ऐसे डोमेन में गहन और विशेष संकेत और उत्तर बनाने के लिए विशिष्ट डोमेन (विषय) ज्ञान वाले लोगों की आवश्यकता हो सकती है जैसे: चिकित्सा |
Turns A prompt and a responding answer is called a turn. Some projects require the user to produce one turn - that would be a prompt (question) and a response (answer). Other projects may require the user to provide a multi-turn conversation. The image to the right shows an example of what a two-turn conversation would look like.
|
टर्न एक प्रॉम्प्ट और एक प्रतिक्रियात्मक उत्तर को टर्न कहा जाता है। कुछ प्रोजेक्ट में उपयोगकर्ता को एक टर्न बनाने की आवश्यकता होती है - जो एक प्रॉम्प्ट (प्रश्न) और एक प्रतिक्रिया (उत्तर) होगा। अन्य प्रोजेक्ट में उपयोगकर्ता को एक से अधिक टर्न वाली बातचीत प्रदान करने की आवश्यकता हो सकती है। दाईं |
Do not under any circumstances use a generative chat/LLM model such as ChatGPT when completing such tasks. Do not use the model to create content, check facts, brainstorm ideas, etc.
Using a generative chat tool etc is a breach of this project and you may have your account terminated.
|
ऐसे कार्यों को पूरा करते समय किसी भी परिस्थिति में ChatGPT जैसे जनरेटिव चैट/LLM मॉडल का उपयोग न करें। सामग्री बनाने, तथ्यों की जाँच करने, विचारों पर विचार-विमर्श करने आदि के लिए मॉडल का उपयोग न करें। जनरेटिव चैट टूल आदि का उपयोग करना इस परियोजना का उल्लंघन है और आपका खाता समाप्त किया जा सकता है। |
Red Teaming Tasks Red teaming is like having someone play the bad guy to test how well something works. The goal is to find any weak spots or problems that might be missed otherwise. It's kind of like a practice round to make sure everything is strong and ready to go. In terms of LLM tasks, this may be using an AI model and trying to get it to break its own policies or safety guidelines. These tasks may be quite sensitive in nature and challenging to complete. Even though you know you are pretending, it may be uncomfortable to use offensive language or to communicate unpleasant ideas. We offer support and guidance to those taking part in such projects, and not taking part in, or leaving, the project does not affect anyone's profile or future participant in other projects. Labelling and Grading Project Labelling can include tasks such as looking at prompts and/or response and labelling them for topics present etc. Grading can include tasks that evaluate and assess a model response, this helps ensure the LLM is providing responses which are accurate and coherent. Labelling and grading can include:
|
रेड टीमिंग कार्य रेड टीमिंग ऐसा है जैसे किसी को खलनायक की भूमिका निभाकर यह परखना कि कोई चीज कितनी अच्छी तरह काम करती है। इसका लक्ष्य किसी भी कमजोर बिंदु या समस्या का पता लगाना है जो अन्यथा छूट सकती है। यह सुनिश्चित करने के लिए एक अभ्यास दौर की तरह है कि सब कुछ मजबूत है और आगे बढ़ने के लिए तैयार है। एलएलएम कार्यों के संदर्भ में, यह एक एआई मॉडल का उपयोग कर सकता है और इसे अपनी नीतियों या सुरक्षा दिशानिर्देशों को तोड़ने के लिए प्रेरित करने का प्रयास कर सकता है। ये कार्य प्रकृति में काफी संवेदनशील और पूरा करने में चुनौतीपूर्ण हो सकते हैं। भले ही आप जानते हों कि आप दिखावा कर रहे हैं, लेकिन आपत्तिजनक भाषा का उपयोग करना या अप्रिय विचारों को संप्रेषित करना असहज हो सकता है। हम ऐसे प्रोजेक्ट में भाग लेने वालों को सहायता और मार्गदर्शन प्रदान करते हैं, और प्रोजेक्ट में भाग न लेने या छोड़ने से किसी की प्रोफ़ाइल या अन्य प्रोजेक्ट में भविष्य के प्रतिभागी पर कोई प्रभाव नहीं पड़ता है। प्रोजेक्ट को लेबल करना और ग्रेड करना लेबलिंग में प्रॉम्प्ट और/या प्रतिक्रिया को देखना और उन्हें मौजूद विषयों के लिए लेबल करना आदि जैसे कार्य शामिल हो सकते हैं। ग्रेडिंग में ऐसे कार्य शामिल हो सकते हैं जो मॉडल प्रतिक्रिया का मूल्यांकन और आकलन करते हैं, इससे यह सुनिश्चित करने में मदद मिलती है कि एलएलएम ऐसी प्रतिक्रियाएँ प्रदान कर रहा है जो सटीक और सुसंगत हैं। लेबलिंग और ग्रेडिंग में ये शामिल हो सकते हैं: सटीकता - क्या प्रतिक्रिया सटीक है? क्या यह तथ्यात्मक रूप से सही जानकारी और उपयोगकर्ता द्वारा वांछित परिणाम प्रदान कर रहा है। निष्ठा और सुसंगतता - यह उत्पन्न पाठ की सुसंगतता, प्रासंगिकता और समग्र गुणवत्ता का आकलन करता है। स्थानीय उपयुक्तता - क्या उत्पन्न पाठ उपयोगकर्ता के स्थानीय के लिए उपयुक्त है। इसमें स्थानीय विशिष्ट जानकारी (यूएस में पासपोर्ट के लिए आवेदन कैसे करें बनाम ईयू में पासपोर्ट के लिए आवेदन कैसे करें) या यहां तक कि क्षेत्रीय वर्तनी (रंग बनाम रंग) जैसे भाषा संस्करण भी शामिल हो सकते हैं |
Glossary • • • • • • • • • • • • • • • • • • • • • • • •
|
शब्दावली • • • • • • • • • • • • • • • • • • • • • • • • |
Summary Large Language Models (LLMs) are important machine learning tools that use deep learning algorithms to work with and understand human language. These models learn from huge amounts of text data to understand patterns and connections in language. LLMs can do various language-related tasks, like translating languages, analyzing feelings, having conversations like a chatbot, and more. They can understand complicated written information, recognize things and how they’re connected, and create new text that makes sense and follows grammar rules! Large language models are leading the way in artificial intelligence. They can do a lot, like generate text that seems human, help with easy language translation, figure out emotions in text, and even make computer code. These models are useful in different areas like technology, healthcare, marketing, and more. They’re not just tools for language; they’re key parts in shaping the future of artificial intelligence. You can revisit this module at any time using Open Module(opens in a new tab) Why not bookmark it for future reference? As a next step, you will have to complete the certification by answering the test questions. The link to the certification is provided at the bottom of the SCREEN. If you are reading the module in a standalone window, please ensure you are logged into your OneForma, in the General LLM certification and at the bottom of the screen which displays the module you will see the 'proceed to exam' button Good luck! |
सारांश बड़े भाषा मॉडल (LLM) महत्वपूर्ण मशीन लर्निंग उपकरण हैं जो मानव भाषा के साथ काम करने और उसे समझने के लिए डीप लर्निंग एल्गोरिदम का उपयोग करते हैं। ये मॉडल भाषा में पैटर्न और कनेक्शन को समझने के लिए बड़ी मात्रा में टेक्स्ट डेटा से सीखते हैं। LLM विभिन्न भाषा-संबंधी कार्य कर सकते हैं, जैसे भाषाओं का अनुवाद करना, भावनाओं का विश्लेषण करना, चैटबॉट की तरह बातचीत करना, और बहुत कुछ। वे जटिल लिखित जानकारी को समझ सकते हैं, चीजों को पहचान सकते हैं और यह जान सकते हैं कि वे कैसे जुड़ी हुई हैं, और नया टेक्स्ट बना सकते हैं जो समझ में आता है और व्याकरण के नियमों का पालन करता है! बड़े भाषा मॉडल आर्टिफिशियल इंटेलिजेंस में अग्रणी हैं। वे बहुत कुछ कर सकते हैं, जैसे कि ऐसा टेक्स्ट बनाना जो मानवीय लगता है, आसान भाषा अनुवाद में मदद करना, टेक्स्ट में भावनाओं को समझना और यहां तक कि कंप्यूटर कोड बनाना। ये मॉडल प्रौद्योगिकी, स्वास्थ्य सेवा, विपणन और बहुत कुछ जैसे विभिन्न क्षेत्रों में उपयोगी हैं। वे केवल भाषा के लिए उपकरण नहीं हैं; वे आर्टिफिशियल इंटेलिजेंस के भविष्य को आकार देने में महत्वपूर्ण भूमिका निभाते हैं। आप किसी भी समय इस मॉड्यूल को फिर से देख सकते हैं ओपन मॉड्यूल (नए टैब में खुलता है) भविष्य के संदर्भ के लिए इसे बुकमार्क क्यों न करें? अगले चरण के रूप में, आपको परीक्षण प्रश्नों का उत्तर देकर प्रमाणन पूरा करना होगा। प्रमाणन का लिंक स्क्रीन के नीचे दिया गया है। यदि आप मॉड्यूल को स्टैंडअलोन विंडो में पढ़ रहे हैं, तो कृपया सुनिश्चित करें कि आप अपने OneForma में लॉग इन हैं, सामान्य LLM प्रमाणन में और स्क्रीन के नीचे जो मॉड्यूल प्रदर्शित करता है, आपको 'परीक्षा के लिए आगे बढ़ें' बटन दिखाई देगा शुभकामनाएँ! |
Education Loan*
!शुभ शरुआत स्टार्ट पे के साथ!
Flexible Corporate, Personal Loan |
Working Capital Demand Loan |
LOAN AGAINST PROPERTY
बिजनेस फूलेगा फलेगा, जब लोन आसान से मिलेगा |
BUSINESS PHOOLEGA PHALEGA, JAB LOAN AASANI SE MILEGA |
SHUBH KAAM, MEIN DERI KESI |
BUSINESS PHOOLEGA PHALEGA, JAB LOAN AASANI SE MILEGA |
Eligibility Criteria for Car Loans
Sale & Purchase - Refinace BT Topup
Brand Partner Merchant Onboarding*
!Shubh Shuruaat Start Pay ke Sath!
Start-Pay-YouTube
आपके समय और प्रयास के लिए धन्यवाद। यदि आपके कोई प्रश्न हों,
Contact Page: https://startpayonline.com/contact/
Additional Information
Knowledge Base:https://crm.startpayonline.com/knowledge-base
तो कृपया मुझसे संपर्क करने में संकोच न करें।
शुरू हो जाओ - "एसपीओं-SPO"
Terms & Conditions apply*