title: DH terminology author: José Luis Losada Palenzuela date: 25/03/2021 autosize: TRUE font-family: 'Times New Roman'
-
Pierwsze kroki w R.
-
Opis danych: bibliografia
-
Zotero (narzędzie do zarządzania bibliografią).
-
Manipulacjia i wizualizacja danych w R (na wykresach, na mapach, w sieciach).
Kod i dane editio/dataviz
- 1_scripts_ggplot.R
- 2_scripts_maps.R
- 3_scripts_redes.R
- R używa wiersz poleceń (command-line)
- "Run current line/selection": Ctrl+Enter (Windows/Linux), Command+Enter (Mac)
Formalny język programowania: używa słów, aby zaprogramować (napisać) kod (algorytm): n.p., policzyć liczbę słów.
Srodowiska do obliczeń statystycznych oraz wizualizacji wyników.
- variable (zmienna): to, co nazywamy (nazwa związana z wartością).
- command/instruction (wyrażenie, polecenia, instrukcja): to, co polecamy (kierując się zasadami).
- function (funkcja): to, co się dzieje, się wykonuje
- argument (argument, parametr): to, co modyfikuje, co jest wpisane (w funkcjach)
- operator (operator): to, co przypisywa, co łączy.
-
Nie używamy R sensu stricto jako języka programowania, ale jako narzędzie, które ma już przedefiniowane funkcje.
-
Rstudio (środowisko programistyczne, IDE): Konsola oraz panele/okna
- object (obiekt): to, co mamy, co manipulujemy.
- package (pakiet): zestaw funkcji, dokumentacji i danych (opcjonalnie).
-
Bibliografia stylometrii
-
ok. 3000 (obserwacji)
-
Zestaw danych rzeczywistych
-
Podzbiór 91 (obserwacji)
-
stylometry_sample.csv
-
asignatura_sample.csv
-
pakiet: tidyverse albo ggplot2
-
główna funkcja:
ggplot()
-
system warstwowy: atrybuty geometryczne (punkty, słupki, ...), estetyka (kolor, rozmiar, ...), obliczenia statystyczne.
-
inne funkcje dla zmiennych:
aes()
-
warstwy dodane ze znakiem (operatorem) +
-
Metoda reprezentacji połączeń lub wzorców interakcji między częściami systemu.
-
Pojęcie sieci zakłada strukturę relacyjną, którą można badać logicznie i matematycznie: Teoria grafów (dyscyplina)
-
Eksploracja poprzez wizualizację.
- Sieć: punkty połączone liniami.
- Punkty: węzły lub wierzchołki (nodes albo vertices).
- Linie: krawędzie (edges albo links).
- Rodzaje sieci: sieci dwudzielny (bipartite, affiliation graph)
- graf, którego wierzchołki można podzielić na dwa rozłączne zbiory
- sieci dwudzielny autorów i etykiet.
- Algorytmy do rysowania grafów w sposób wizualnych.
- Algorytm Force Atlas bazuje na balansie sił, biorąc pod uwagę wagę krawędzi.