Kif Google BERT Vs. Smith Algorithms Work Together - Semalt Overview




Google reċentement joħroġ karta ta 'riċerka dwar l-algoritmu NLP il-ġdid tagħhom SMITH. Dan id-dokument enfasizza ħafna professjonisti tas-SEO dwar il-bidliet li jiġġustifikaw żidiet jew tnaqqis fil-klassifikazzjoni SERP. Madankollu, it-tħassib tagħna hawnhekk huwa kif dan l-algoritmu SMITH ġdid iqabbel ma 'BERT?

Fil-karta ppubblikata minn Google, huma ddikjaraw li SMITH tissupera lill-BERT meta tifhem mistoqsijiet fit-tfittxija u dokumenti twal. Dak li jagħmel lil SMITH tant interessanti huwa li jista 'jifhem siltiet f'dokument simili għal dak li jagħmel BERT bi kliem u sentenzi. Din il-karatteristika mtejba ta 'SMITH tippermettilha tifhem dokumenti itwal faċilment.

Iżda qabel ma mmorru iktar 'il quddiem, irridu ninfurmawkom li minn issa, SMITH mhix live fl-algoritmi ta' google. Imma jekk l-ispekulazzjonijiet tagħna huma tajbin, ser jitnieda flimkien mal-indiċjar tal-passaġġ, jew se jiġi qabel dan. Jekk int verament interessat li titgħallem kif tikklassifika fuq SEP, it-tagħlim bil-magna inevitabbilment imur spalla ma 'spalla għal dan l-interess.

Mela lura għas-suġġett, BERT wasal biex jinbidel? Mhux il-biċċa l-kbira tad-dokumenti fuq il-web li huma vasti, robusti u għalhekk għandhom prestazzjoni aħjar ma 'SMITH?

Ejja naqbżu 'l quddiem u naraw dak li kkonkludejna. SMITH jista 'jagħmel kemm ix-xogħol li jaqra dokumenti robusti kif ukoll irqaq. Aħseb dwarha bħal Bazooka. Jista 'jikkawża ħsara kbira billi jista' wkoll jiftaħ il-bibien.

Biex Tibda, Għaliex BERT Jew SMITH?

Il-vera mistoqsija hawnhekk hija għaliex magna tat-tiftix teħtieġ Proċessar ta 'Tagħlim Naturali biex tipprovdi r-riżultati tat-tfittxija. It-tweġiba hija sempliċi. Il-magni tat-tiftix jeħtieġu NLP fit-tranżizzjoni tagħhom minn kordi jew kliem ewlieni li jifhmu l-magna tat-tiftix għal affarijiet jew paġni tal-web.

Fejn Google m'għandux idea, x'iktar jista 'jkun fuq il-paġna għajr il-kliem kjavi jew jekk il-kontenut li jiġi indiċjat jagħmilx sens anke fir-rigward tat-tfittxija. Grazzi għall-NLP, Google jista 'jifhem il-kuntest tal-karattri ttajpjati fil-mistoqsija tat-tfittxija tiegħu.
Grazzi għall-NLP, Google jista 'jiddistingwi l-intenzjonijiet ta' utent meta jgħid "xmara" u "kont bankarju." Jista 'jifhem ukoll dikjarazzjonijiet bħal "Caroline iltaqgħet ma' ħbiebha għal xarba, xorb, pinta, ale, brew ..." bħala mhux naturali.

Bħala esperti fis-SEO, irridu ngħidu li l-fehim tal-mistoqsija tat-tfittxija mxiet 'il bogħod. L-aħjar jemmnu li kien eċċessivament diffiċli li ssib l-artikoli t-tajba fuq l-internet fil-passat.

Nifhmu BERT

BERT bħalissa jiffunzjona bħala l-aħjar mudell NLP li għandna għal ħafna, jekk mhux għall-biċċa l-kbira, applikazzjonijiet, speċjalment meta tiġi biex tifhem strutturi tal-lingwa kumplessi. Ħafna jqisu l-ewwel karattru Bidirezzjonali bħala l-akbar qabża 'l quddiem f'dan l-algoritmu. Pjuttost milli jkollu algoritmu li jaqra mix-xellug għal-lemin, BERT jista 'wkoll jifhem il-kliem b'relazzjoni mal-kuntest tagħhom. B'dan il-mod, ma jagħtix riżultati għall-kliem individwali mqiegħda fil-mistoqsija imma jindiċi paġni web ibbażati fuq it-tifsira kollettiva tal-kliem fit-tfittxija.

Hawn hu eżempju biex tiffaċilita l-fehim tiegħek:

TRAKK GĦANDHA DAWL.

Kieku tinterpreta dik l-istqarrija mix-xellug għal-lemin, malli tilħaq il-kelma "dawl", int tikklassifika t-trakk bħala xi ħaġa bid-dawl. Dan għaliex it-trakk ġie quddiem id-dawl fl-istqarrija.

Imma jekk irridu nikklassifikaw l-affarijiet fuq trakkijiet, nistgħu nħallu barra "ħfief" għax ma niltaqgħux magħha qabel "trakk".

Huwa diffiċli li tikkunsidra d-dikjarazzjoni f'direzzjoni waħda biss.

Barra minn hekk, BERT għandu wkoll benefiċċju sigriet ieħor li huwa tant notevoli, u jippermetti l-ipproċessar tal-lingwa b'mod effettiv bi spiża tar-riżorsi aktar baxxa meta mqabbla mal-mudelli preċedenti. Dak huwa tabilħaqq fattur importanti li għandek tikkonsidra meta wieħed irid japplikah għall-web kollu.

L-applikazzjoni tat-tokens hija evoluzzjoni oħra li akkumpanjat lil BERT. Hemm 30,000 tokens f'BERT, u kull waħda minn dawn tirrappreżenta kelma komuni b'xi koppja tokens żejda għal karattri u frammenti f'każ li teżisti kelma barra t-30,000.

Permezz tal-abbiltà tiegħu li jipproċessa tokens u transformers, BERT fehem il-kontenut, li tah ukoll il-kapaċità li jifhem sentenzi b’mod adegwat.

Mela jekk ngħidu, "it-tfajla marret il-bank. Aktar tard poġġiet fuq ix-xatt tax-xmara u rat il-fluss tax-xmara".

BERT se jassenja valuri differenti lil dawk is-sentenzi għaliex qed jirreferu għal żewġ affarijiet differenti.

Nifhmu lil SMITH

Imbagħad jiġi SMITH, algoritmu b'riżorsi u numri aħjar biex jintuża għall-ipproċessar ta 'dokumenti akbar. BERT juża madwar 256 tokens għal kull dokument, u meta jaqbeż dan il-limitu, l-ispiża tal-kompjuters issir għolja wisq għall-aħjar funzjoni. B'kuntrast, SMITH jista 'jimmaniġġa sa 2,248 tokens għal kull dokument. Dak hu madwar 8X in-numru ta 'użi ta' token BERT.

Biex nifhmu għaliex l-ispejjeż tal-kompjuters jiżdiedu f'mudell NLP wieħed, l-ewwel irridu nikkunsidraw dak li hemm bżonn biex tifhem sentenza u paragrafu. Meta tittratta sentenza, hemm kunċett ġenerali wieħed biss x'nifhmu. Hemm inqas kliem relatati ma 'xulxin u għalhekk inqas konnessjonijiet bejn il-kliem u l-ideat li għandhom fil-memorja.

Billi tagħmel sentenzi f'paragrafi, il-konnessjoni bejn dawn il-kliem tiġi mmultiplikata ħafna. Proċessi 8X it-test ikun jeħtieġ ħafna iktar drabi fil-veloċità u l-kapaċità ta 'ottimizzazzjoni tal-memorja bl-użu tal-istess mudell. Dan huwa fejn SMITH tagħmel id-differenza kollha billi bażikament tagħmel lott u tagħmel ħafna proċessar offline. Interessanti li SMITH għadu jiddependi fuq BERT biex jiffunzjona sewwa.

Hawnhekk hawn deskrizzjoni ta 'kif SMITH jieħu dokument fil-qalba tiegħu:
  1. L-ewwel taqsam id-dokument f'daqsijiet ta 'raggruppament li huma aktar faċli biex jiġu mmaniġġjati.
  2. Imbagħad tipproċessa kull blokka ta 'sentenzi individwalment.
  3. Transformer imbagħad jitgħallem rappreżentazzjoni kuntestwali ta 'kull blokka, wara li jibdilhom f'rappreżentazzjoni ta' dokument.

Kif Jaħdem SMITH?

Biex tħarreġ il-mudell SMITH, nitgħallmu minn BERT b'żewġ modi:

Biex tħarreġ lil BERT, kelma tinħareġ minn sentenza, u jiġu pprovduti għażliet alternattivi

Il-BERT, li huwa mħarreġ aħjar, huwa dak li se jkollu iktar suċċess fl-għażla tal-għażla t-tajba mill-alternattivi pprovduti. Pereżempju, jekk BERT jingħata s-sentenza:

Il-kannella ferħan ------ qabeż fuq l-ilqugħ tal-picket.
  • L-ewwel għażla - tadam.
  • It-tieni għażla - kelb.
Iktar ma jkun imħarreġ il-BERT, iktar ikunu ċ-ċansijiet tiegħu li jagħżlu l-għażla t-tajba, li hija l-għażla tnejn.

Dan il-metodu ta 'taħriġ huwa applikat ukoll f'SMITH ukoll.

SMITH Huwa Mħarreġ Għal Dokumenti Kbar

Iktar ma jkun SMITH imħarreġ aħjar, iktar huma ċ-ċansijiet tiegħu li jagħraf sentenzi barra. Hija l-istess idea ma 'BERT iżda applikazzjoni differenti. Din il-parti hija partikolarment interessanti minħabba li tpinġi dinja b'kontenuti ġġenerati minn Google mqiegħda flimkien f'paġni tar-riżultati tal-magna tat-tiftix b'ħitan. Naturalment, l-utenti jistgħu jitilqu, iżda mhux għax Google jistgħu jgħaqqdu flimkien kontenut qasir u twil mill-aħjar sorsi kollha fuq il-paġna tar-riżultat tagħha.

Jekk għandek dubju dwar dan li jiġri, għandek tkun taf li diġà beda jiġri, u għalkemm għadhom ma kkontrollawhx, huwa bidu.

SMITH Huwa Aħjar Minn BERT?

Ma 'dak kollu li qrajt, huwa kompletament naturali li tassumi li SMITH hija aħjar, u f'ħafna kompiti, tassew hija aħjar. Imma kkunsidra kif tuża l-internet għal mument; liema mistoqsijiet iddaħħal regolarment fi mistoqsijiet tat-tfittxija?
  • "X'inhu t-tbassir tat-temp għal-lum?"
  • "Direzzjonijiet għal restorant".
It-tweġiba għal tali mistoqsijiet ta ’tfittxija normalment teħtieġ kontenut qasir, ħafna drabi b’dejta limitata u mhux ikkumplikata. SMITH huwa aktar involut fil-fehim ta 'dokumenti itwal u aktar kumplessi u mistoqsijiet ta' tfittxija twal u kumplessi.

Dan se jinkludi tqegħid flimkien ta 'diversi dokumenti u suġġetti biex joħolqu t-tweġibiet tagħhom. Jiddetermina kif il-kontenut jista 'jinqasam, u jippermetti lil Google tkun taf x'inhu tajjeb biex turi. Dan jgħin lil Google jifhem kif il-paġni tal-kontenut huma relatati ma 'xulxin, u jipprovdi skala li fuqha jistgħu jiġu vvalutati links fost benefiċċji oħra.

Ma 'dak li ntqal, aħna nikkonkludu billi ngħidu li kemm BERT kif ukoll SMITH huma importanti, u t-tnejn jaqdu l-iskop uniku tagħhom.

Konklużjoni

Filwaqt li SMITH huwa l-bazooka, għandna bżonnha biex npinġu stampa ċara ta ’kif inhuma l-affarijiet kollettivament. Fir-riżorsi, tiswa aktar għax tagħmel xogħol akbar, iżda tiswa ħafna inqas minn BERT meta tagħmel dak l-istess xogħol.

BERT jgħin lil SMITH biex jgħin il-fehim tiegħu ta 'mistoqsijiet qosra u biċċiet żgħar ta' kontenut. Dan huwa, madankollu, sakemm Google tiżviluppa algoritmu NLP ieħor li jissostitwixxi t-tnejn, u allura aħna nimxu u nlaħħqu ma 'avvanz ieħor fis-SEO.

Interessat fis-SEO? Iċċekkja l-artikli l-oħra tagħna fuq il- Blog Semalt.

mass gmail