Visual Methodologies

Aangereikt door:

het Lectoraat Visual Methodologies qualitative & quantitative data practices. “Groen in de stad”

Samenvatting

Door middel van het scrapen van het data van sociale media, dit kan zowel instagram of twitter zijn, kan de visualisatie verbanden naar voren brengen. Hierbij kan je zien of er verschillende bots of advertenties verband hebben met het onderwerp. Door de verschillende verbanden verder online te gaan opzoeken wat dit verband met elkaar heeft kun je hierdoor een klein stukje over schrijven. Dit kan als informatieverslag in het verdere onderzoek gebruikt worden, en eventueel als onderbouwing naar de opdrachtgever gebruikt wordt waardoor de data van de situatie visueel wordt uitgebeeld.

Hoe werkt het?

Fase

Je kan deze methode gebruiken in de eerste fase van je ontwerpproces, waarbij je de data gaat analyseren.

Duur

De duur van deze methode hangt af van de beschikbare tijd voor het onderzoek. Het kan variëren van één uur met het werken met Gephi tot in hoeverre je als gebruiker blij met het resultaat bent van de visualisatie. Na de visualisatie moet deze data geanalyseerd worden dit kan ook van een uur tot meerdere dagen/weken duren. Dit ligt aan de hoeveelheid data en als je alleen analyseert of experts erbij gaat betrekken (groepen).
Onze lectoraat duurde een week, waarbij we over 3 dagen ongeveer 6 contacturen hadden, de rest van de week was je zelf aan de opdracht bezig, en leverde je op vrijdagmiddag het verslag in.

Benodigdheden / welke data

Voor deze methode heb je een computer nodig. Data die je wil analyseren (dit geval twitter-tweets). Deze dat zal in een dataset opgeslagen moeten worden. Deze dataset kan gemaakt worden met verschillende tools (TCAT een tool online https://wiki.digitalmethods.net/Dmi/ToolDmiTcat ). De dataset download je in Gephi dit is de data visualisatie tool. En internet of experts waarmee ja na de datavisualisatie de data kan analyseren.

Moeilijkheidsgraad 1/5

De moeilijkheidsgraad in deze methode is het leren omgaan met bepaalde tools. Voordat je een data visualisatie kan maken, zal je moeten weten welke hashtags (#) je wil extraheren. Om deze datasets te kunnen maken voordat je in Gephi er mee aan de slag kan gaan is het lastigste gedeelte, hierdoor is de moeilijkheidsgraag ook een 5.

Gephi zelf is een 3/4 in moeilijkheidsgraad, dit is voornamelijk omdat je het jezelf zo moeilijk mogelijk kan maken. Het is voornamelijk oefenen en leren omgaan met de verschillende opties die Gephi biedt.

Voor en nadelen

+ Je kan gemakkelijk de kleine aantallen eruit filteren.
+ Je kan data analyseren die je normaal niet kan herkennen.
+ je kan patronen zien die je normaal niet kan zien.
+ Je kan data analyseren die je normaal niet kan herkennen.
+ je kan patronen zien die je normaal niet kan zien.

– Je kan een verkeerd algoritme gebruiken waardoor verkeerde uitkomst krijgt te zien.
– Je hebt een goede computer nodig.
– Het is een ingewikkeld programma waardoor je zonder ervaring lastig goede visualisaties kan creëren.

Uitwerking

Installeer gephi; https://gephi.org/users/download/

Pak de dataset die eindigt op ; gdf.
We gaan vandaag werken met twitter hashtags.
Als het goed is zie je links appearance en layout.
Bij layout klik je ForceAltas2 aan, dit is een algoritme die de data gaat clusteren voor een visueel beeld.

Daarna klik je LinLog aan en prevent overlap. Hierna klik je op run. en na een tijdje op stop. Hierdoor heeft je computer verschillende clusters van de hashtags gemaakt.
Wanneer je op het T icoontje links onderin klikt verschijnt er tekst bij de dot, dit is de hashtag die is gebruikt.

Rechts in je scherm staat de optie filter, hierbij klik je de optie Topology aan, daarna degree range. Hierbij wordt de query zichtbaar. De slider kun je hiermee aanpassen met hoeveel verbindingen de hashtag moet hebben. Hierdoor wordt je visualisatie wat meer clean, je kan deze dus het beste vanaf bijvoorbeeld 2-207 zetten of 10-200.
Wanneer er diverse hashtags meerdere malen aan elkaar gekoppeld zitten maar vrij weinig met het hoofdonderwerp te maken hebben gaat het vaak om bots of advertenties.

Hierna ga je naar appearance, links bovenin, daar klik je op size, daarna op ranking, en op word frequency, hierdoor zal de bol groter worden als de hashtag vaker gebruikt wordt. Dit wordt aangeraden om min 10 en max 50 te zetten.

Nu gaan we statistiek toepassen dit zit rechtsboven in, daarna klik je op modularity, daarbij krijg je de size distribution te zien. Daarna klik je op close. Het is belangrijk dat je dit eerst heb gedaan voor je naar de volgende stap gaat.

We gaan nu naar appearance, links bovenin, daarna naar color, partition, modularity. Hierbij krijgen de diverse clusters een verschillende kleur, het handigste is om alleen verschillende kleuren te gebruiken en geen grijstinten. Hierbij wordt je visuele beeld duidelijker.

Daarna ga je naar preview mode, en klik je op refresh, bij show labels laat hij de verschillende hashtags zien, en zie je als het goed is de kleuren die je met appearance aan de clusters hebt gegeven. Hieruit kun je halen welke clusters je mee te maken hebt in je onderzoek.

Dit kun je opslaan als pdf en gebruiken in je onderzoek.Onderstaande data visualisaties zijn weergaves hoe het er uit zou kunnen komen te zien.

Vervolg op deze methode
Wanneer je een data visualisatie hebt gemaakt en deze hebt geanalyseerd. Heb je een breder begrip van jou onderzoek en welke punten hier in mee werken. Ook heb je hoogstwaarschijnlijk connecties tussen punten gevonden. Deze connecties kunnen of totaal niet van het belang zijn in jou onderzoek. Wanneer dit wel zo is, kun je hier mee verder gaan werken. Deze methode is ook wat er ook al eerder in dit document gezegd is een methode dat vrij in het begin wordt gebruikt. Dit kun je zien in de deskresearch veld. Een vervolgstap is een methode te kiezen bijvoorbeeld uit de fieldresearch veld. Wat kan zijn methode expertinterview of observatie. Dit ligt geheel aan de vorm en onderwerp van jou opgestelde onderzoek.

Gerelateerde methodes

Gephi is een data-visualisatie tool. Datavisualisatie is de methode waarmee je grote stukken data overzichtelijker kan maken voor jou en je mede onderzoekers. Gephi is natuurlijk niet de enigste hierin er zijn meer programma’s die soortgelijke ondersteuningen aanbieden.

Tableau Public & Tableau Gallery
Met interactieve, visuele analyse kan je onoverzichtelijke zakelijke vragen ontwarren en snel inzicht krijgen in bedrijfs/onderzoeksvragen. Aangedreven door een gepatenteerde VizQL-technologie, is Tableau een krachtige analyses om diepere vragen te stellen en zinvolle antwoorden te geven.

Microsoft Power BI
Microsoft Power BI is een interactieve tool voor het visualiseren van data, ontwikkeld en uitgegeven door het Amerikaanse softwarebedrijf Microsoft. Het doel is om business intelligence beschikbaar te maken voor de eindgebruiker.

Google Data studio
Met Google Data Studio kan je meerdere weergaven van je gegevens en dashboards opbouwen in plaats van eenmalige, publicatie-klaar visualisaties. Er zit wel enige tijd in om het te leren, maar het is niet vrij moeilijk om te gebruiken. Google AnalyticsFree op Google is ook geïntegreerd met Google Data studio.

Referenties verschillende tools

https://www.pcmag.com/article/347315/10-free-data-visualization-tools https://docs.microsoft.com/nl-nl/power-bi/desktop-what-is-desktop https://www.wiseo.be/blog/google-data-studio

Studenten van de minor 2018/2019