Gå videre til hovedindholdet

Opslag

Tilpasset semantisk emnesøgning med Google

Med en Google-konto kan man oprette sine egne personlige søgemaskiner. Disse kan tilpasses, således at de kun søger på bestemte webdomæner eller efter websider indeholdende specifikke semantiske schema.org-typer. De kan også indstilles, så de løfter søgeresultater indeholdende udvalgte ord og udtryk. Google har dog for nyligt tilføjet endnu en interessant funktionalitet: nu kan man nemlig også angive, hvilket eller hvilke emner, der skal danne rammen for en søgning, eller hvilke emner, fremfundne søgeresultater kan filtreres efter. Et par eksempler: Jeg har opdateret min søgemaskine, der leder efter nyhedsartikler (især om fodbold), dvs. websider, der er opmærket med schema.org-typen “NewsArticle”. Søgeresultater kan nu filtreres efter "fodboldemnerne" "FC København", "Brøndby" og "FC Midtjylland", som det ses i nedenstående screenshot: Jeg har også lavet et par helt nye emneorienterede søgemaskiner. En fremfinder sider på hele nettet,
Seneste opslag

Google understøtter nu FAQPage-data direkte i søgeresultater

I bestræbelserne på at gå fra at være en søgemaskine til at være en egentlig svaremaskine er Google nu begyndt direkte at præsentere svar på spørgsmål i deres søgeresultater.  Det sker ved at vise strukturerede data opmærket med schema.org-typer som FAQPage og HowTo. FAQPage bruges til at opmærke spørgsmål og svar på en FAQ, Frequently Asked Questions, en webside dedikeret til netop dette formål. Et eksempel på en FAQ opmærket i overensstemmelse med Googles retningslinjer er FAQ'en på dette website . De enkelte spørgsmål og svar fra FAQ'en kan udtrækkes af Google og vises i en udfoldelig harmonika, således som det fremgår af nedenstående screenshot: Googles læsning af siden - og dens underliggende strukturerede data - kan ses her i Googles testværktøj .

VoiceSearch: Gør dit webindhold "speakable" - med XPath

I version 3.5 af schema.org er typen SpeakableSpecification indført som "gyldigt medlem". Denne type gør det muligt at opmærke webindhold som "speakable", altså egnet til at blive læst højt, for eksempel som svar i stemmestyret søgning (Voice Search) Der findes flere måder at udpege de tekstafsnit på en webside, som er "speakable". En er at bruge CSS-selektorer . En anden er XPath. XPath er et sprog til at identificere bestemte elementer i et hierarkisk dokument som et XML-eller (X)HTML-dokument. Et eksempel på brugen af XPath i forbindelse med SpeakableSpecification kunne være denne FAQ. Den relevante kodelinje i eksemplet er den med rødt angivne: <script type="application/ld+json"> {  "@context": "https://schema.org/",  "@type": "FAQPage",  "name": "Semantisk søgning og søgemaskineoptimering",  "speakable": {   "@type": "SpeakableSpecificatio

Schema.org 3.5 nu på gaden

Version 3.5 af vokabularet schema.org er nu på gaden. Den nye version er især karakteriseret ved, at en række typer og egenskaber er flyttet fra "pending" - altså schema.org's elementer på prøve, så at sige - over i selve kernevokabularet. Det gælder ikke mindst typer som "FAQPage" og "SpeakableSpecification" - typer som kan siges at være centrale i forhold til svaremaskineoptimering (AEO - Answer Engine Optimization) og stemmestyret søgning, Voice Search. En oversigt over alle opdateringerne kan ses her .

VoiceSearch: Gør dit webindhold "speakable" - med CSS-selektorer

Med produkter som Google Home og Google Assistant har Google sat turbo på Voice Search, stemmestyret søgning. Søgemaskine-giganten er i den forbindelse begyndt at understøtte semantisk opmærkning med "speakable"-egenskaben fra vokabularet schema.org (dog i første omgang i USA). Som navnet antyder, bruges "speakable" til at indikere, hvilke dele af en (web)tekst, der er særlig velegnet til at blive læst op. Rent teknisk henviser speakable-metadata til bestemte elementer i en websides HTML-struktur. Disse kan udpeges på forskellige måde. En er at benytte en såkaldt CSS-selektor, som en indikator, der normalt har til formål at identificere elementer, der skal formateres på en bestemt måde. Men nu altså også elementer, der skal "formateres mundtligt", så at sige. Nedenstående kodeeksempel viser, hvordan det kan gøres. Eksemplet består af schema.org-metadata i dataformatet Json-LD indlejret i et HTML script-element. Af disse metadata fremgår det af CSS-sele

Semantisk opmærkning af grafik

Semantisk opmærkning og strukturerede data associeres typisk med websider i HTML. Men også visse former for grafik kan opmærkes med semantiske metadata. Det gælder således for grafik i SVG, Scalable Vector Graphics, som er et XML-format til publicerering af to-dimensionel, interaktiv grafik på web og lignende steder. SVG repræsenterer grundlæggende grafik som geometriske figurer på et canvas. Disse figurer kan grupperes, farvelægges, flyttes på canvas med videre. SVG indeholder desuden metadata-elementer som <title> og <desc> til beskrivelse af de enkelte (grupperede) figurer eller det samlede canvas. Indholdet af disse elementer kan imidlertid også anvendes i en mere standardiseret semantisk opmærkning, som søgemaskiner som Google kan læse og afkode. Et simpelt eksempel på semantisk opmærket SVG er denne repræsentation af Dannebrog . Eksemplet er opmærket med vokabularet schema.org og dataformatet RDFa og vist i W3Schools' editor.

Flavored links - nu med kode

Flavored links - semantiske links - kan implementeres på almindelige websider. Tag et eksempel som denne side , der indeholder information om en række kurser udbudt af en fiktiv kursusudbyder.  I selve kildekoden er der opmærket en række navngivne relationer mellem de enkelte kurser og kursusudbyderen Webdesign Uni. Opmærkningen er foretaget med vokabularet schema.org og dataformatet RDFa.  Den semantiske opmærkning af Webdesign Uni ser således ud i kildekoden: <div typeof="EducationalOrganization" resource="#webuni" class="w3-container w3-margin-top"> <h1 property="name">Webdesign Uni</h1> <h3>Kurser</h3> </div> Parafraseret siger dette kodestykke noget i retning af: der findes en entitet af schema.org-typen "EducationalOrganization" med navnet "Webdesign Uni". Denne entitet har endvidere det semantiske id "#webuni" udtrykt som værdien af RDFa-attributten &q

Links med og uden smag

En af de fundamentale forskelle mellem det traditionelle web og det semantiske web, The Web of Data, er links. På det traditionelle web er links, eller hypertekstlinks, koblinger mellem websider eller dele af disse, og det, der gør det muligt at navigere rundt på websider eller mellem sådanne. Hypertekstlinks er allestedsnærværende på websites og et af de helt definerende træk ved World Wide Web. På det semantiske web udgør links, såkaldte "flavored links", derimod semantiske relationer mellem entiteter - objekter, begivenheder eller fænomener. Hvor et link på det traditionelle web kan knytte en side om skuespilleren Leonardo DiCaprio til siden om filmen The Revenant, vil et flavored link på The Web of Data specificere den relation, der eksisterer mellem den pågældende person og den pågældende film, og som naturligt kunne navngives med "medvirker i" eller lignende. Det er i virkeligheden sådanne navngivne relationer, der udgør fundamentet for det, der nogle gang

Hvad er schema.org egentlig?

Schema.org er populært sagt det "sprog", som Google og andre søgemaskiner forstår, dvs kan identificere og afkode. Mere teknisk kan schema.org siges at være: Et vokabular : et sæt af termer til at beskrive et bestemt domæne (fx Person, Book, Store, owns, author) En taksonomi : et klassifikationsystem, i hvilket kategorier (også kaldet typer eller klasser) er ordnet i en hierarkisk struktur (fx Thing > Organization > LocalBusiness > Store) Et polyhierarki : et klassifikationsystem, i hvilket kategorier er ordnet i en hierarkisk struktur, men hvor underkategorier kan være underordnet mere end en overordnet kategori (fx Thing > Organization > LocalBusiness > Store; Thing > Place > LocalBusiness > Store) En ontologi : et klassifikationssystem, i hvilket kategorier kan relateres (Person owns Store; Book author Person) Ressourcer om schema.org kan blandt andet ses her .

Fra microdata eller RDFa til Json-LD: Et skift med omkostninger

Websites og websider kan opmærkes med schema.org-metadata i flere dataformater, nemlig p.t. microdata, RDFa og Json-LD. Sidstnævnte er det format, som Google anbefaler i dag. Nogle websites har ændret deres schema.org-opmærkning, således at den er i overensstemmelse med Googles seneste anbefaling. Det gælder for eksempel The Internet Movie Database , der er skiftet fra  microdata til Json-LD. En sådant skift har formentlig ikke nogen umiddelbar betydning for brugere, der benytter Googles almindelige søgemaskine. Men ændringen har en stor konsekvens for brugere af Googles tilpassede søgemaskiner, Custom Search Engines, idet disse faktisk IKKE understøtter Json-LD for nærværende. Et lille eksempel er min egen tilpassede søgemaskine, Min moviemaskine , der leder efter film på et par filmsites, primært IMDb. Denne er nu nærmest ubrugelig, som det fremgår af nedenstående søgeresultat, der viser de westerns, som John Wayne, skulle have medvirket i. En ynk, ikke!

Google - hvordan skifter jeg dæk på min bil?

Med større og større fokus på at kunne svare på brugerspørgsmål - frem for blot at præsentere en liste af blå links - har Google og andre søgemaskiner behov for i højere grad at kunne hente svar i form af strukturerede data direkte fra diverse hjemmesider, blogs, online fora mv. Svar på spørgsmål af typen "hvordan ..." eller "hvorledes ..." vil ofte kunne gøres maskinlæsbare med schema.org-typen "HowTo", der har til formål at forklare, hvordan en given opgave løses trinvist. HowTo -typen er en kategori, der giver rig mulighed for, i detaljer, at specificere, hvad der kræves for at løse opgaven - fx hvor lang tid det tager eller hvilket værktøj, der er nødvendigt - herunder hvad de enkelte trin indebærer eller forudsætter. HowTo-modellen gør det endvidere muligt at beskrive en given fremgangsmåde, dens enkelte trin og dens resultat med såvel tekst som multimediale elementer som lyd, billede eller video. De enkelte trin i en HowTo-procedure opmærkes m

Hvad er forskellen på en QAPage og en FAQPage?

I schema.org findes der både en "QAPage" og "FAQPage". Begge typer bruges til opmærkning af websider med spørgsmål og svar. Forskellen er, at sidstnævnte indeholder en eller flere "FAQ"'er (Frequently Asked Questions), mens førstnævnte primært er tænkt til strukturering af websider med et enkelt spørgsmål og et eller flere mulige svar herpå. Mens "QAPage" er en del af kernevokabularet, er "FAQPage" indtil videre "pending", altså under overvejelse. Google er i beskedent omfang begyndt at anvende strukturerede data fra websider opmærket med "QAPage"-typen i deres søgeresultater. Søgemaskinen stiller dog særlige krav til opmærkning med "QAPage", således som det fremgår af deres dokumentation . For eksempel skal sidens spørgsmål, "Question", kobles til siden via egenskaben "mainEntity", mens svar, "Answer" skal knyttes til siden gennem en af de to egenskaber "accepte

Opmærkning af begreber og deres definition med schema.org

Blandt schema.org's "pending" typer, altså kategorier under overvejelse, findes nu henholdsvis "DefinedTerm" og "DefinedTermSet". Disse typer kan bruges til at definere (faglige) begreber, til at organisere dem i lister, for eksempel et glossar, og sidst men ikke mindst, selvfølgelig at gøre dem maskinlæsbare for søgemaskiner og andet websoftware. Et glossar med et par udvalgte begreber inden for semantisk søgning og søgemaskineoptimering kunne se ud: <script type="application/ld+json">   {     "@context": "http://schema.org/",     "@type": "DefinedTermSet",     "name": "Glossar: Semantisk søgning og SEO",     "hasDefinedTerm":       [           {         "@type": "DefinedTerm",         "name": "Semantisk søgning",         "description": "Søgning, der sigter på at give brugere meningsfulde søgeresu

Answer Engine Optimization (AEO) er svaret. Hvad var spørgsmålet?

Google og andre søgemaskiner er i disse år ved at udvikle sig til "svaremaskiner". Mens de tidligere primært leverede blå links til udvalgte websteder forsøger de nu i mange tilfælde at give direkte tilbagemelding på brugernes forespørgsler gennem præsentation af kort, tekstuddrag, billeder, videoer, såkaldte videnskort med videre. Og konkrete spørgsmål som "Hvor højt er Rundetårn?" eller "størrelse Danmark" bevares med specifikke koncise svar. Der er nok flere grunde til denne udvikling, men den stadige stigning i søgning på mobil og via Voice Search er en væsentlig faktor. Brugere på farten vil have direkte svar, hvis det kan lade sig gøre, ikke links til yderligere materiale. Udviklingen kommer uden tvivl til at have implikationer for søgemaskineoptimering (SEO), som vi kender det i dag. Faktisk er der dem, der mener, at AEO - answer engine optimization - i høj grad kommer til præge feltet fremover. AEO kan ses som en specialiseret form for SEO, der h

Hør lige en gang: er dine strukturerede data "speakable"?

I takt med at Voice Search, dvs. stemmestyret søgning, vinder frem, bliver det mere og mere hensigtsmæssigt at kunne opmærke webindhold, der er egnet til at blive læst op som (en del af) et svar på en brugerforespørgsel. Til dette formål kan man nu anvende schema.org-egenskaben " speakable ", som kan benyttes til at identificere tekstdele af en "WebPage" eller "Article" (eller underkategorier af disse), som skønnes særligt velegnede til at blive konverteret til lyd gennem tekst-til-tale syntese. Rent teknisk foregår opmærkning med "speakable" ved, at man i sine schema.org-metadata peger på de(t) relevante HTML-element(er) i artiklen eller på websiden. Identifikation kan for eksempel ske gennem CSS-selektorer eller XPath-stier. Google er allerede kommet med deres guidelines for brugen af "speakable" og er så småt begyndt at gøre brug af oplæst indhold i deres Home- og Assistant-produkter (indtil videre dog vist kun på engelsk og i

Semantisk opmærkning i Blogger

Semantisk opmærkning med schema.org bliver stadig nemmere, idet flere og flere hjælpeværktøjer som editorer og valideringsværktøjer bliver tilgængelige på Nettet. CMS-systemer, som f.eks. WordPress, tilbyder også i stigende grad funktionalitet, plug-ins og lignende, der kan gøre det lettere for almindelige brugere at føje schema.org-metadata til deres websider. Dette gælder også for et blogging-værktøj som Blogger, som denne blog jo er lavet med. Her har man mulighed for, via en formular, at udstille relevante strukturerede data om bloggen i dataformatet Json-LD. Nogle af disse data genereres automatisk af Blogger, men man kan frit tilføje flere. Sådan ser formularen og de automatisk genererede data ud: Med Googles testværktøj kan man se, hvilke schema.org-metadata bloggen aktuelt er opmærket med (klik på Blog i vinduet til højre).   

Hvad kan man semantisk opmærke med schema.org?

Et centralt spørgsmål i semantisk søgemaskineoptimering er, hvad man kan opmærke med schema.org  og således - i princippet - gøre maskinlæsbart for Google og andre søgemaskiner. Schema.org indeholder efterhånden så mange typer og egenskaber, at det kan være vanskeligt at overskue de mange muligheder, der ligger i dette vokabular. Men følgende lille liste kan måske være en hjælp: Genre : Man kan til dels opmærke, hvilken genre en given webside eller websted manifesterer. Er det det for eksempel en blog, en FAQ, en artikel, en anmeldelse, en opskrift eller en underkategori til en af disse såsom en nyhedsartikel eller er det en form for specialiseret webside som eksempelvis en søgeresultatside. Struktur : Man kan opmærke, hvilke dele eller ressourcer en given webside består af (= strukturelle metadata). Man kan anføre, hvilke indlæg en blog indeholder, hvilke spørgsmål og svar, en FAQ omfatter, hvad der er ingredienser og fremgangsmåde i en opskrift eller hvad der er hhv. overskrift o

Så starter vi forfra ...

Jeg fik aldrig gang i denne blog, så nu prøver vi igen. Ideen er nu at skrive små indlæg om emner inden for semantisk søgning og søgemaskineoptimering (SEO) med fokus på schema.org og Googles brug af "strukturerede data", dvs. webindhold opmærket med schema.org. Bloggen er en slags løbende opdatering af min lille bog Semantisk søgning og søgemaskineoptimering . Jeg vil forsøge i det omfang, det er muligt, her at gøre opmærksom på nyheder og nye tiltag, tendenser, opdatering af Googles retningslinjer mv. Bloggen kan også ses som et supplement til mit lille Google-site , der indeholder links til mere permanente ressourcer om semantisk søgning og SEO.