Mine sisu juurde

AI kiirendi: erinevus redaktsioonide vahel

Allikas: Vikipeedia
Eemaldatud sisu Lisatud sisu
RPiir (arutelu | kaastöö)
PResümee puudub
RPiir (arutelu | kaastöö)
Resümee puudub
3. rida: 3. rida:


AI kiirendeid kasutatakse mobiilseadmetes, näiteks närvitöötlusüksused (NPU-d) Apple'i [[iPhone|iPhone'ides]]<ref>{{Cite web |title=Deploying Transformers on the Apple Neural Engine |url=https://machinelearning.apple.com/research/neural-engine-transformers |access-date=April 30, 2024 |website=Apple Machine Learning Research |language=en-US}}</ref> ja [[Huawei]] mobiiltelefonides<ref>{{cite web|title=HUAWEI Reveals the Future of Mobile AI at IFA|url=https://consumer.huawei.com/en/press/news/2017/ifa2017-kirin970}}</ref>, isiklikes arvutites, näiteks [[Apple Silicon]] Mac'ides ning pilvandmetöötlusserverites, näiteks Google'i Pilveplatvormi [[TPU|TPU-d]]<ref>{{Cite journal|date=2017-06-24|title=In-Datacenter Performance Analysis of a Tensor Processing Unit|journal=ACM SIGARCH Computer Architecture News|volume=45|issue=2|pages=1–12|language=EN|doi=10.1145/3140659.3080246|doi-access=free |last1=Jouppi |first1=Norman P. |last2=Young |first2=Cliff |last3=Patil |first3=Nishant |last4=Patterson |first4=David |last5=Agrawal |first5=Gaurav |last6=Bajwa |first6=Raminder |last7=Bates |first7=Sarah |last8=Bhatia |first8=Suresh |last9=Boden |first9=Nan |last10=Borchers |first10=Al |last11=Boyle |first11=Rick |last12=Cantin |first12=Pierre-luc |last13=Chao |first13=Clifford |last14=Clark |first14=Chris |last15=Coriell |first15=Jeremy |last16=Daley |first16=Mike |last17=Dau |first17=Matt |last18=Dean |first18=Jeffrey |last19=Gelb |first19=Ben |last20=Ghaemmaghami |first20=Tara Vazir |last21=Gottipati |first21=Rajendra |last22=Gulland |first22=William |last23=Hagmann |first23=Robert |last24=Ho |first24=C. Richard |last25=Hogberg |first25=Doug |last26=Hu |first26=John |last27=Hundt |first27=Robert |last28=Hurt |first28=Dan |last29=Ibarz |first29=Julian |last30=Jaffey |first30=Aaron |display-authors=1 |arxiv=1704.04760 }}</ref>. Selles kategoorias eksisteerib mitmeid müüjaspetsiifilisi termineid ning tegemist on areneva tehnoloogiaga ilma domineeriva disainita.
AI kiirendeid kasutatakse mobiilseadmetes, näiteks närvitöötlusüksused (NPU-d) Apple'i [[iPhone|iPhone'ides]]<ref>{{Cite web |title=Deploying Transformers on the Apple Neural Engine |url=https://machinelearning.apple.com/research/neural-engine-transformers |access-date=April 30, 2024 |website=Apple Machine Learning Research |language=en-US}}</ref> ja [[Huawei]] mobiiltelefonides<ref>{{cite web|title=HUAWEI Reveals the Future of Mobile AI at IFA|url=https://consumer.huawei.com/en/press/news/2017/ifa2017-kirin970}}</ref>, isiklikes arvutites, näiteks [[Apple Silicon]] Mac'ides ning pilvandmetöötlusserverites, näiteks Google'i Pilveplatvormi [[TPU|TPU-d]]<ref>{{Cite journal|date=2017-06-24|title=In-Datacenter Performance Analysis of a Tensor Processing Unit|journal=ACM SIGARCH Computer Architecture News|volume=45|issue=2|pages=1–12|language=EN|doi=10.1145/3140659.3080246|doi-access=free |last1=Jouppi |first1=Norman P. |last2=Young |first2=Cliff |last3=Patil |first3=Nishant |last4=Patterson |first4=David |last5=Agrawal |first5=Gaurav |last6=Bajwa |first6=Raminder |last7=Bates |first7=Sarah |last8=Bhatia |first8=Suresh |last9=Boden |first9=Nan |last10=Borchers |first10=Al |last11=Boyle |first11=Rick |last12=Cantin |first12=Pierre-luc |last13=Chao |first13=Clifford |last14=Clark |first14=Chris |last15=Coriell |first15=Jeremy |last16=Daley |first16=Mike |last17=Dau |first17=Matt |last18=Dean |first18=Jeffrey |last19=Gelb |first19=Ben |last20=Ghaemmaghami |first20=Tara Vazir |last21=Gottipati |first21=Rajendra |last22=Gulland |first22=William |last23=Hagmann |first23=Robert |last24=Ho |first24=C. Richard |last25=Hogberg |first25=Doug |last26=Hu |first26=John |last27=Hundt |first27=Robert |last28=Hurt |first28=Dan |last29=Ibarz |first29=Julian |last30=Jaffey |first30=Aaron |display-authors=1 |arxiv=1704.04760 }}</ref>. Selles kategoorias eksisteerib mitmeid müüjaspetsiifilisi termineid ning tegemist on areneva tehnoloogiaga ilma domineeriva disainita.

== Ajalugu ==

Arvutisüsteemid on tihtipeale täiendanud CPU-sid spetsiaalselt selleks otstarbeks mõeldud kiirenditega, mida tuntakse koprotsessoritena. Märkimisväärsed [[Rakendus-spetsiifiline integraallülitus|rakendusspetsiifilised]] [[Laiendplaat|laiendplaadid]] on näiteks [[Videokaart|graafikakaardid]] graafika jaoks, [[Helikaart|helikaardid]], [[Graafikaprotsessor|graafikaprotsessorid]] ja [[Signaaliprotsessor|signaaliprotsessorid]]. Kuna süvaõppe ja tehisintellekti koormused muutusid 2010ndatel aastatel üha tähtsamaks, arendati välja või kohandati olemasolevatest toodetest spetsialiseeritud laiendplaate nende ülesannete kiirendamiseks.

=== Esimesed katsed ===

Esimesed katsed, näiteks [[Intel|Inteli]] ETANN 80170NX, kasutasid analoogahelaid, et arvutada neuronfunktsioonide.<ref name=ICH_1>{{cite web| title=Inside Track| author=Dvorak, J.C.| url=https://archive.org/details/PC_Magazine_1990_05_29_v9n10/page/n83/mode/2up| publisher=PC Magazine| volume=9| issue=10| date=29 May 1990| access-date=26 December 2023}}</ref>

Hiljem järgnesid täis-digitaalsed kiibid nagu Nestor/Intel Ni1000. Juba aastal 1993 kasutati [[Signaaliprotsessor|signaaliprotsessorit]] tehisnärvivõrkude kiirendamiseks optilise märgituvastuse tarkvara puhul.<ref>{{cite web |url=https://www.youtube.com/watch?v=FwFduRA_L6Q |title=convolutional neural network demo from 1993 featuring DSP32 accelerator|website=[[YouTube]] }}</ref>

Aastaks 1988 olid Wei Zhang jt arutanud kiirete optiliste rakenduste realiseerimist konvolutsioonilistes närvivõrkudes tähestiku tundmiseks.<ref name="wz1988">{{cite journal |last=Zhang |first=Wei |date=1988 |title=Shift-invariant pattern recognition neural network and its optical architecture |journal=Proceedings of Annual Conference of the Japan Society of Applied Physics}}</ref><ref name="wz1990">{{cite journal |last=Zhang |first=Wei |date=1990 |title=Parallel distributed processing model with local space-invariant interconnections and its optical architecture |journal=Applied Optics |volume=29 |issue=32 |pages=4790–7 |doi=10.1364/AO.29.004790 |pmid=20577468 |bibcode=1990ApOpt..29.4790Z}}</ref>

1990ndatel prooviti luua paralleelseid kõrge läbilaskevõimega süsteeme tööjaamadele, mis olid suunatud mitmesugustele rakendustele, sealhulgas tehisintellekti simulatsioonidele.<ref name=DCS_1>{{cite journal| title=Designing a connectionist network supercomputer| author1=Asanović, K.| author2=Beck, J.| author3=Feldman, J.| author4=Morgan, N.| author5=Wawrzynek, J.| url=https://www.researchgate.net/publication/15149042| journal=[[International Journal of Neural Systems]]| publisher=ResearchGate| volume=4| issue=4| pages=317–26| date=January 1994| access-date=26 December 2023| doi=10.1142/S0129065793000250| pmid=8049794}}</ref><ref name="krste general purpose">{{cite web |title=The end of general purpose computers (not) | website=[[YouTube]] |url=https://www.youtube.com/watch?v=VtJthbiiTBQ}}</ref>

[[FPGA]]-põhiseid kiirendeid uuriti esmakordselt 1990ndatel tehisnärvivõrgu treenimise eesmärgil.<ref name="fpga-inference">{{cite web| title=Space Efficient Neural Net Implementation| author1=Gschwind, M.| author2=Salapura, V.| author3=Maischberger, O.| url=https://www.researchgate.net/publication/2318589| date=February 1995| access-date=26 December 2023}}</ref><ref name="fpga-training">{{cite book |chapter=A Generic Building Block for Hopfield Neural Networks with On-Chip Learning |year=1996 |doi=10.1109/ISCAS.1996.598474 |s2cid=17630664 |title=1996 IEEE International Symposium on Circuits and Systems. Circuits and Systems Connecting the World. ISCAS 96 |last1=Gschwind |first1=M. |last2=Salapura |first2=V. |last3=Maischberger |first3=O. |pages=49–52 |isbn=0-7803-3073-0}}</ref>

Aastal 2014 pakkusid Chen jt välja DianNao (hiina keeles "elektriline aju")<ref name=":1">{{Cite journal|last1=Chen|first1=Tianshi|last2=Du|first2=Zidong|last3=Sun|first3=Ninghui|last4=Wang|first4=Jia|last5=Wu|first5=Chengyong|last6=Chen|first6=Yunji|last7=Temam|first7=Olivier|date=2014-04-05|title=DianNao|journal=ACM SIGARCH Computer Architecture News|volume=42|issue=1|pages=269–284|doi=10.1145/2654822.2541967|issn=0163-5964|doi-access=free}}</ref>, et kiirendada süvanärvivõrke. Hiljem pakkusid sama grupi liikmed välja järglased (DaDianNao,<ref name=":2">{{Cite book|last1=Chen|first1=Yunji|last2=Luo|first2=Tao|last3=Liu|first3=Shaoli|last4=Zhang|first4=Shijin|last5=He|first5=Liqiang|last6=Wang|first6=Jia|last7=Li|first7=Ling|last8=Chen|first8=Tianshi|last9=Xu|first9=Zhiwei|last10=Sun|first10=Ninghui|last11=Temam|first11=Olivier|title=2014 47th Annual IEEE/ACM International Symposium on Microarchitecture |chapter=DaDianNao: A Machine-Learning Supercomputer |date=December 2014|pages=609–622|publisher=IEEE|doi=10.1109/micro.2014.58|isbn=978-1-4799-6998-2|s2cid=6838992}}</ref> ShiDianNao,<ref name=":3">{{Cite journal|last1=Du|first1=Zidong|last2=Fasthuber|first2=Robert|last3=Chen|first3=Tianshi|last4=Ienne|first4=Paolo|last5=Li|first5=Ling|last6=Luo|first6=Tao|last7=Feng|first7=Xiaobing|last8=Chen|first8=Yunji|last9=Temam|first9=Olivier|date=2016-01-04|title=ShiDianNao|journal=ACM SIGARCH Computer Architecture News|volume=43|issue=3S|pages=92–104|doi=10.1145/2872887.2750389|issn=0163-5964}}</ref> PuDianNao<ref name=":4">{{Cite journal|last1=Liu|first1=Daofu|last2=Chen|first2=Tianshi|last3=Liu|first3=Shaoli|last4=Zhou|first4=Jinhong|last5=Zhou|first5=Shengyuan|last6=Teman|first6=Olivier|last7=Feng|first7=Xiaobing|last8=Zhou|first8=Xuehai|last9=Chen|first9=Yunji|date=2015-05-29|title=PuDianNao|journal=ACM SIGARCH Computer Architecture News|volume=43|issue=1|pages=369–381|doi=10.1145/2786763.2694358|issn=0163-5964}}</ref>), moodustades DianNao perekonna<ref>{{Cite journal|last1=Chen|first1=Yunji|last2=Chen|first2=Tianshi|last3=Xu|first3=Zhiwei|last4=Sun|first4=Ninghui|last5=Temam|first5=Olivier|date=2016-10-28|title=DianNao family|journal=Communications of the ACM|volume=59|issue=11|pages=105–112|doi=10.1145/2996864|s2cid=207243998|issn=0001-0782}}</ref>.

[[Nutitelefon]]id hakkasid AI kiirendeid kasutama alates Qualcomm Snapdragon 820-st aastal 2015<ref>{{Cite web|title=Qualcomm Helps Make Your Mobile Devices Smarter With New Snapdragon Machine Learning Software Development Kit|url=https://www.qualcomm.com/news/releases/2016/05/02/qualcomm-helps-make-your-mobile-devices-smarter-new-snapdragon-machine |website=Qualcomm}}</ref><ref>{{Cite web|last=Rubin|first=Ben Fox|title=Qualcomm's Zeroth platform could make your smartphone much smarter|url=https://www.cnet.com/tech/mobile/qualcomms-zeroth-platform-could-make-your-smartphone-much-smarter/|access-date=September 28, 2021|website=CNET|language=en}}</ref>.

Redaktsioon: 30. aprill 2024, kell 23:41

AI kiirendi, süvaõppe protsessor või närvitöötlusüksus (NPU) on spetsialiseeritud riistvarakiirendi[1]või arvutisüsteem[2], mis on loodud tehisintellekti ja masinõppe rakenduste kiirendamiseks. Tüüpilised rakendused on näiteks algoritmid robootikale, nutistule ning muudele andmemahukatele või sensoripõhistele ülesannetele.

AI kiirendeid kasutatakse mobiilseadmetes, näiteks närvitöötlusüksused (NPU-d) Apple'i iPhone'ides[3] ja Huawei mobiiltelefonides[4], isiklikes arvutites, näiteks Apple Silicon Mac'ides ning pilvandmetöötlusserverites, näiteks Google'i Pilveplatvormi TPU-d[5]. Selles kategoorias eksisteerib mitmeid müüjaspetsiifilisi termineid ning tegemist on areneva tehnoloogiaga ilma domineeriva disainita.

Ajalugu

Arvutisüsteemid on tihtipeale täiendanud CPU-sid spetsiaalselt selleks otstarbeks mõeldud kiirenditega, mida tuntakse koprotsessoritena. Märkimisväärsed rakendusspetsiifilised laiendplaadid on näiteks graafikakaardid graafika jaoks, helikaardid, graafikaprotsessorid ja signaaliprotsessorid. Kuna süvaõppe ja tehisintellekti koormused muutusid 2010ndatel aastatel üha tähtsamaks, arendati välja või kohandati olemasolevatest toodetest spetsialiseeritud laiendplaate nende ülesannete kiirendamiseks.

Esimesed katsed

Esimesed katsed, näiteks Inteli ETANN 80170NX, kasutasid analoogahelaid, et arvutada neuronfunktsioonide.[6]

Hiljem järgnesid täis-digitaalsed kiibid nagu Nestor/Intel Ni1000. Juba aastal 1993 kasutati signaaliprotsessorit tehisnärvivõrkude kiirendamiseks optilise märgituvastuse tarkvara puhul.[7]

Aastaks 1988 olid Wei Zhang jt arutanud kiirete optiliste rakenduste realiseerimist konvolutsioonilistes närvivõrkudes tähestiku tundmiseks.[8][9]

1990ndatel prooviti luua paralleelseid kõrge läbilaskevõimega süsteeme tööjaamadele, mis olid suunatud mitmesugustele rakendustele, sealhulgas tehisintellekti simulatsioonidele.[10][11]

FPGA-põhiseid kiirendeid uuriti esmakordselt 1990ndatel tehisnärvivõrgu treenimise eesmärgil.[12][13]

Aastal 2014 pakkusid Chen jt välja DianNao (hiina keeles "elektriline aju")[14], et kiirendada süvanärvivõrke. Hiljem pakkusid sama grupi liikmed välja järglased (DaDianNao,[15] ShiDianNao,[16] PuDianNao[17]), moodustades DianNao perekonna[18].

Nutitelefonid hakkasid AI kiirendeid kasutama alates Qualcomm Snapdragon 820-st aastal 2015[19][20].

  1. "Intel unveils Movidius Compute Stick USB AI Accelerator". 21. juuli 2017. Originaali arhiivikoopia seisuga 11. august 2017. Vaadatud 30. aprillil 2024.
  2. "Inspurs unveils GX4 AI Accelerator". 21. juuni 2017.
  3. "Deploying Transformers on the Apple Neural Engine". Apple Machine Learning Research (Ameerika inglise). Vaadatud 30. aprillil 2024.
  4. "HUAWEI Reveals the Future of Mobile AI at IFA".
  5. Jouppi, Norman P.; et al. (24. juuni 2017). "In-Datacenter Performance Analysis of a Tensor Processing Unit". ACM SIGARCH Computer Architecture News (inglise). 45 (2): 1–12. arXiv:1704.04760. DOI:10.1145/3140659.3080246.
  6. Dvorak, J.C. (29. mai 1990). "Inside Track". PC Magazine. Vaadatud 26. detsembril 2023.
  7. "convolutional neural network demo from 1993 featuring DSP32 accelerator". YouTube.
  8. Zhang, Wei (1988). "Shift-invariant pattern recognition neural network and its optical architecture". Proceedings of Annual Conference of the Japan Society of Applied Physics.
  9. Zhang, Wei (1990). "Parallel distributed processing model with local space-invariant interconnections and its optical architecture". Applied Optics. 29 (32): 4790–7. Bibcode:1990ApOpt..29.4790Z. DOI:10.1364/AO.29.004790. PMID 20577468.
  10. Asanović, K.; Beck, J.; Feldman, J.; Morgan, N.; Wawrzynek, J. (jaanuar 1994). "Designing a connectionist network supercomputer". International Journal of Neural Systems. ResearchGate. 4 (4): 317–26. DOI:10.1142/S0129065793000250. PMID 8049794. Vaadatud 26. detsembril 2023.
  11. "The end of general purpose computers (not)". YouTube.
  12. Gschwind, M.; Salapura, V.; Maischberger, O. (veebruar 1995). "Space Efficient Neural Net Implementation". Vaadatud 26. detsembril 2023.
  13. Gschwind, M.; Salapura, V.; Maischberger, O. (1996). "A Generic Building Block for Hopfield Neural Networks with On-Chip Learning". 1996 IEEE International Symposium on Circuits and Systems. Circuits and Systems Connecting the World. ISCAS 96. Lk 49–52. DOI:10.1109/ISCAS.1996.598474. ISBN 0-7803-3073-0. S2CID 17630664.
  14. Chen, Tianshi; Du, Zidong; Sun, Ninghui; Wang, Jia; Wu, Chengyong; Chen, Yunji; Temam, Olivier (5. aprill 2014). "DianNao". ACM SIGARCH Computer Architecture News. 42 (1): 269–284. DOI:10.1145/2654822.2541967. ISSN 0163-5964.
  15. Chen, Yunji; Luo, Tao; Liu, Shaoli; Zhang, Shijin; He, Liqiang; Wang, Jia; Li, Ling; Chen, Tianshi; Xu, Zhiwei; Sun, Ninghui; Temam, Olivier (detsember 2014). "DaDianNao: A Machine-Learning Supercomputer". 2014 47th Annual IEEE/ACM International Symposium on Microarchitecture. IEEE. Lk 609–622. DOI:10.1109/micro.2014.58. ISBN 978-1-4799-6998-2. S2CID 6838992.
  16. Du, Zidong; Fasthuber, Robert; Chen, Tianshi; Ienne, Paolo; Li, Ling; Luo, Tao; Feng, Xiaobing; Chen, Yunji; Temam, Olivier (4. jaanuar 2016). "ShiDianNao". ACM SIGARCH Computer Architecture News. 43 (3S): 92–104. DOI:10.1145/2872887.2750389. ISSN 0163-5964.
  17. Liu, Daofu; Chen, Tianshi; Liu, Shaoli; Zhou, Jinhong; Zhou, Shengyuan; Teman, Olivier; Feng, Xiaobing; Zhou, Xuehai; Chen, Yunji (29. mai 2015). "PuDianNao". ACM SIGARCH Computer Architecture News. 43 (1): 369–381. DOI:10.1145/2786763.2694358. ISSN 0163-5964.
  18. Chen, Yunji; Chen, Tianshi; Xu, Zhiwei; Sun, Ninghui; Temam, Olivier (28. oktoober 2016). "DianNao family". Communications of the ACM. 59 (11): 105–112. DOI:10.1145/2996864. ISSN 0001-0782. S2CID 207243998.
  19. "Qualcomm Helps Make Your Mobile Devices Smarter With New Snapdragon Machine Learning Software Development Kit". Qualcomm.
  20. Rubin, Ben Fox. "Qualcomm's Zeroth platform could make your smartphone much smarter". CNET (inglise). Vaadatud 28. septembril 2021.