gedefined
gedefinieerd
gedefined
gedefinieerd
verdwijnd
verdwijnT
lambda functie
Kan je dit nog extra toelichten?
geskipped
geskipt of overslaan
geskipped
geskipt of overslaan
geskipped
geskipt of overslaan
geskipped
geskipt of overslaan
qua
Qua wat? De zin stopt hier abrupt.
skipped
skipped -> skipt. Of slaat over gebruiken.
float64
Kan je uitleggen wat float64 is?
deze minder parameters heeft
Ja en nee, grootste reden dan .loadtxt sneller is is omdat het minder checks doet en ervan uitgaat dat de data al schoon is
Het kolomscheidingsteken
Dit staat nu heel vreemd. Maak hier een zin van voor juiste interpunctie en zinsstructuur.
ingebouwde
Plot is geen ingebouwde python functie.
dezelfde vorm
Let op: de structuur (rij/kolom) komt overeen, maar de types worden omgezet (meestal naar getallen). Dus niet letterlijk dezelfde vorm. Wellicht klein beetje verduideliking
Dit maakt het gemakkelijker om later dit bestand terug te vinden.
Maak dit nog directer voor studenten: “Zet je bestanden in een vaste map (bijv. data/) zodat je pad in de code altijd hetzelfde blijft.” of iets dergelijks
één van de 2 lists,
het gaat niet om “2 lists”, maar om rijen/regels in het bestand.
voorbeeld
Maak hier 1 zin extra van die direct verwijst naar de code: “Hieronder lezen we voorbeeld.csv in met np.loadtxt() en printen we de ingelezen data.”
foutloos te werk kon.
“zonder fouten kon worden ingelezen” is duidelijker dan “te werk kon”.
geformat
geformat -> geformatteerd
csv
voor de netheid hier hoofdletters van maken
Tussen de werking van np.loadtxt en np.genfromtxt zit niet zo veel verschil, maar de manier waarop zij met de data omgaan is wel verschillend.
Dubbel/vaag. Beter: “loadtxt = snel/streng (net als numeriek). genfromtxt = robuuster (kan met missende waarden/strings).
Om te voorkomen dat er ooit een error kan ontstaan, wordt er aangeraden om altijd na te gaan of het te analyseren bestand goed geformat is.
Dit is te absoluut. “Open het bestand kort in een teksteditor en check of elke regel hetzelfde aantal waardes heeft en of er geen rare lege velden staan.” of iets dergelijks zou een betere student instructie zijn.
Als dit niet het geval is, dan zal np.loadtxt altijd een Error geven. np.genfromtxt kan ook een error geven, maar deze is hier wat beter op afgestemd.
Te stellig. Simpeler voor studenten: “Ze lijken op elkaar, maar loadtxt is strikter en genfromtxt is toleranter bij missende/rommelige waarden.
python object
Python-object (streepje)
kan misschien tussen haakjes dat picklen, serialiseren betekent
protocol versie
protocolversie (aaneen)
dump()
Voeg 1 voorbeeldzin toe: “Gebruik dump() als je direct naar een bestand wilt schrijven, dumps() als je bytes in een variabele wilt.” iets in die trend
returned
geeft terug/returnt
geïnteresseerde
geïnteresseerdeN
wordt
worden
python objecten naar een byte-object.
Misschien praktisch maken? Zegt een gemiddelde student misschein weinig.
"Pickle wordt gebruikt om python-objecten op te slaan en later weer terug te laden" iets in deze trend er bijzetten. Maakt het praktisch voor studenten
Ideaal dus voor het verwerken van medische gegevens door studenten klinische technologie
Het is ideaal voor onder andere studenten van klinische technologie. Dit voorbeeld kan wat minderen beladen zijn, er wordt nu bijna gesuggereerd dat dit het meest voornamelijke gebruik voor is. Beter misschein algemeen maken zoals "handig voor opslaan van python resultaten". daarna kan een specifiek voorbeeld wel genoemd worden
grote
grootte
python objecten
python-objecten
python module
taalfout python-module hoort het te zijn
text editor
text editor -> teksteditor
zet dit als hoofdregel: altijd eerst openen in teksteditor (bijv. VS Code/Notepad++)
Misschien ook zo'n warning box voor excel?
Zodat die niet wordt ingelezen te samen met de data en mogelijk errors doet ontstaan bij de verwerking.
Waarom onstaan die errors?
Kan nog bij dat dit wordt veroorzaakt door conversiefouten (bijv. string ->float) als numpy numerieke waarden verwacht.
"doet ontstaan" kan beter neergezet worden als veroorzaakt.
onderscheiden
Verkeerde woordkeuze. Gescheiden hoort het te zijn.
Als dit begint met een hekje (#) is het bestand gemaakt met de bedoeling het te verwerken via numpy.
De header begint met #. Dat is handig als commentaar, maar dan wordt de header vaak niet als kolomnamen ingelezen.
Wil je de kolomnamen echt gebruiken in je code? Zet de header dan niet als commentaar, of lees hem apart in (anders gooit numpy hem weg).
wordt
Wordt --> worden. Data is meervoud.
Strings)
De inhoud wordt inderdaad met python automatisch ingezet in strings, alleen de data in het initiele csv bestand zijn geen strings. Tekst \( \neq \) string
strings
Beetje verwarrend taalgebruik. Strings zijn een specifieke datatype dat gebruikt wordt in programmeercontext. Een csv-bestand slaat alle data op als tekstrepresentaties (karakters), maakt niet uit of er cijfers of datums staan. Het klopt dat bij het inlezen python automatisch er automatisch een str datatype van maakt (met de csv module), maar het is in het initiele csv bestand toch net een klein beetje anders.
We raden je ook aan dit altijd eerst te doen voordat je probeert het bestand in te laden
Kan je ook uitleggen waarom?
voorbeeld
Zou van dit voorbeeldbestand ook een afbeelding ervan tussen de tekst gezet kunnen worden als voorbeeld van hoe het eruit hoort te zien?
tekstverwerker
Tekstverwerker is meer "Word-achtig". Kladblok en notepad++ zijn teksteditors.
Een .csv-bestand is een type tekstbestand
Goed begin, maar kan eventueel nog bij dat een csv eigenlijk een tekstbestand is met tabelvormige data. Een spreadsheet in platte tekst weliswaar. Wellicht kleine voorbeeldfoto erbij?
gegevens of data.
Gegevens en data zijn hetzelfde. Dubbelop. Beter eentje kiezen.