Пређи на садржај

Generativni prethodno obučeni transformator

С Википедије, слободне енциклопедије
Originalni GPT model

Generativni prethodno obučeni transformator (GPT) su tip velikih jezičkih modela (LLM)[1][2][3] i prominentni okvir za generativnu veštačku inteligenciju.[4][5] Oni su veštačke neuronske mreže koje se koriste u zadacima obrade prirodnog jezika.[6] GPT-ovi su zasnovani na arhitekturi transformatora, prethodno obučeni za velike skupove podataka neoznačenog teksta i sposobni da generišu novi sadržaj slično ljudskom radu.[2][3] Od 2023. godine većina LLM-a ima ove karakteristike[7] i ponekad se široko nazivaju GPT-ovi.[8]

Prvi GPT je uveo OpenAI 2018. godine.[9] OpenAI je objavio veoma uticajne GPT fondacijske modele koji su naknadno numerisani, da bi obuhvatali svoju „GPT-n“ seriju.[10] Svaki od njih je bio znatno sposobniji od prethodnog, zbog povećane veličine (broja parametara za obuku) i obuke. Najnoviji od njih, GPT-4, objavljen je u martu 2023. godine.[11] Takvi modeli su bili osnova za njihove GPT sisteme koji su specifični za zadate zadatke, uključujući modele fino podešene za praćenje instrukcija — koji zauzvrat pokreću ChatGPT čatbot servis.[1]

Termin „GPT” se takođe koristi u nazivima i opisima takvih modela koje su razvili drugi. Na primer, drugi modeli GPT osnova uključuju seriju modela kreiranih od strane EleutherAI,[12] i sedam modela koje je kreirao Cerebras 2023. godine.[13] Takođe, kompanije u različitim industrijama razvile su GPT-ove specifične za zadatke u svojim oblastima, kao što je Sejlsfosov „EinsteinGPT“ (za CRM)[14] i Blumbergov „BloombergGPT“ (za finansije).[15]

  1. ^ а б Haddad, Mohammed. „How does GPT-4 work and how can you start using it in ChatGPT?”. www.aljazeera.com. 
  2. ^ а б „Generative AI: a game-changer society needs to be ready for”. World Economic Forum. 9. 1. 2023. 
  3. ^ а б „The A to Z of Artificial Intelligence”. Time. 13. 4. 2023. 
  4. ^ Hu, Luhui (15. 11. 2022). „Generative AI and Future”. Medium. 
  5. ^ „CSDL | IEEE Computer Society”. www.computer.org. 
  6. ^ „LibGuides: Using AI Language Models : ChatGPT”. 
  7. ^ Toews, Rob. „The Next Generation Of Large Language Models”. Forbes. 
  8. ^ Mckendrick, Joe (13. 3. 2023). „Most Jobs Soon To Be 'Influenced' By Artificial Intelligence, Research Out Of OpenAI And University Of Pennsylvania Suggests”. Forbes. 
  9. ^ „Improving language understanding with unsupervised learning”. openai.com (на језику: енглески). 11. 6. 2018. Архивирано из оригинала 2023-03-18. г. Приступљено 2023-03-18. 
  10. ^ „GPT-1 to GPT-4: Each of OpenAI's GPT Models Explained and Compared”. MUO. 11. 4. 2023. 
  11. ^ „GPT-4”. openai.com (на језику: енглески). Приступљено 2023-12-08. 
  12. ^ Alford, Anthony (13. 7. 2021). „EleutherAI Open-Sources Six Billion Parameter GPT-3 Clone GPT-J”. InfoQ. 
  13. ^ „News” (Саопштење). 
  14. ^ Morrison, Ryan (7. 3. 2023). „Salesforce launches EinsteinGPT built with OpenAI technology”. Tech Monitor. 
  15. ^ „The ChatGPT of Finance is Here, Bloomberg is Combining AI and Fintech”. Forbes.