2 Classificatie van tracks

De software bij de radar geeft een automatische classificatie van de ruwe tracks. In tabel 2.1 geven we een overzicht van het aantal ruwe tracks per categorie na automatische classificatie. Het betreft de ruwe tracks van January 2021 tot en met November 2023.

Tabel 2.1: Aantal beschikbare tracks opgedeeld volgens de automatische classificatie. Aandeel: verhouding op totaal
klasse aantal aandeel
SMALL_BIRD 143607011 26.0%
INSECTS 135516955 24.5%
MEDIUM_BIRD 80308285 14.5%
LARGE_BIRD 65911588 11.9%
VEHICLE 41458617 7.5%
UNKNOWN 34912334 6.3%
SLOW_TARGET 26231854 4.7%
FLOCK 14126072 2.6%
AIRCRAFT 5774040 1.0%
FAST_TARGET 4816261 0.9%

Een kleine fractie van de ruwe tracks hebben we in het veld gecontroleerd (tab. 2.2). In tabel 2.3 geven we een overzicht van de waarnemingen. Tenslotte geeft tabel 2.5 per automatische categorie het aantal manueel gecontroleerde tracks dat effectief vogels zijn.

Tabel 2.2: Aantal in het veld manueel gecontroleerde tracks. Aandeel: aandeel manueel controleerde tracks t.o.v. alle tracks per categorie.
klasse automatisch manueel aandeel
SMALL_BIRD 143602675 4336 0.00302%
MEDIUM_BIRD 80304702 3583 0.00446%
FLOCK 14123122 2950 0.02088%
LARGE_BIRD 65910013 1575 0.00239%
INSECTS 135515637 1318 0.00097%
VEHICLE 41458582 35 0.00008%
UNKNOWN 34912316 18 0.00005%
SLOW_TARGET 26231839 15 0.00006%
FAST_TARGET 4816250 11 0.00023%
AIRCRAFT 5774030 10 0.00017%
Tabel 2.3: Tabel 2.4: Aantal beschikbare tracks opgedeeld volgens identificatie in het veld. Aandeel: aandeel t.o.v. het totaal.
vogel soort aantal aandeel
ja zilvermeeuw 1996 14.41%
ja kokmeeuw 1370 9.89%
ja houtduif 1231 8.89%
nee geen vogel 895 6.46%
nee schip 668 4.82%
ja buizerd 584 4.22%
ja gierzwaluw 583 4.21%
ja kauw 493 3.56%
ja grauwe gans 491 3.54%
nee regen 404 2.92%
nee kraan 349 2.52%
ja boerenzwaluw 345 2.49%
ja kleine mantelmeeuw 323 2.33%
ja kievit 301 2.17%
ja kolgans 281 2.03%
ja zwaluw 274 1.98%
nee vleermuis spec 273 1.97%
ja lijster 252 1.82%
ja eend spec 199 1.44%
ja zangvogel 190 1.37%
ja vink 173 1.25%
ja koperwiek 163 1.18%
ja veldleeuwerik 159 1.15%
ja wilde eend 150 1.08%
ja gans spec 147 1.06%
ja spreeuw 143 1.03%
ja grote meeuw 115 0.83%
ja aalscholver 109 0.79%
ja zwartkopmeeuw 100 0.72%
ja zanglijster 83 0.60%
ja holenduif 71 0.51%
ja vogel spec 64 0.46%
ja ooievaar 57 0.41%
ja zwarte kraai 51 0.37%
nee windturbine 50 0.36%
ja slechtvalk 47 0.34%
nee gewone dwergvleermuis 46 0.33%
ja kleine vogel 44 0.32%
ja bruine kiekendief 43 0.31%
ja smient 41 0.30%
ja watersnip 37 0.27%
ja blauwe reiger 32 0.23%
ja canada gans 27 0.19%
ja huiszwaluw 26 0.19%
ja havik 23 0.17%
ja duif spec 22 0.16%
ja nijlgans 20 0.14%
ja sperwer 20 0.14%
nee voertuig 19 0.14%
ja lepelaar 19 0.14%
nee gebouw 18 0.13%
ja graspieper 18 0.13%
ja kleine meeuw 16 0.12%
ja kramsvogel 16 0.12%
ja torenvalk 16 0.12%
ja stormmeeuw 15 0.11%
ja oeverzwaluw 14 0.10%
ja wulp 14 0.10%
ja grote zilverreiger 12 0.09%
ja boomvalk 10 0.07%
ja wespendief 9 0.06%
ja wintertaling 8 0.06%
ja meerkoet 6 0.04%
ja scholekster 6 0.04%
ja boomleeuwerik 5 0.04%
ja grote lijster 5 0.04%
nee balonnetje 4 0.03%
ja goudplevier 4 0.03%
ja keep 4 0.03%
ja krakeend 4 0.03%
ja reiger spec 4 0.03%
ja rietgors 4 0.03%
ja rode wouw 4 0.03%
ja slobeend 4 0.03%
nee openstaande brug 3 0.02%
nee rosse vleermuis 3 0.02%
ja brandgans 3 0.02%
ja witte kwikstaart 3 0.02%
ja bergeend 2 0.01%
ja grutto 2 0.01%
ja middelgrote vogel 2 0.01%
ja uil spec 2 0.01%
ja visarend 2 0.01%
ja grote zaagbek 1 0.01%
ja houtsnip 1 0.01%
ja knobbelzwaan 1 0.01%
ja putter 1 0.01%
ja raaf 1 0.01%
ja visdief 1 0.01%
Tabel 2.5: Manuele controle van automatische classificatie. Aandeel: aandeel tracks dat een vogel is per categorie.
klasse vogel geen vogel aandeel
SMALL_BIRD 4090 246 94.3%
MEDIUM_BIRD 3168 415 88.4%
FLOCK 2450 500 83.1%
INSECTS 942 376 71.5%
LARGE_BIRD 456 1119 29.0%
VEHICLE 5 30 14.3%
FAST_TARGET 4 7 36.4%
SLOW_TARGET 4 11 26.7%
UNKNOWN 0 18 0.0%
AIRCRAFT 0 10 0.0%
totaal 11119 2732 80.3%

2.1 Relevante tracks

Relevante tracks zijn tracks met een hoge waarschijnlijkheid om een vogel te zijn. We stellen dat de tracks voldoende lang in duur moeten zijn. Ten eerste omdat we dan zicht krijgen op een mogelijke verplaatsing. Ten tweede omdat we voldoende lange tracks nodig hebben wanneer we naar verschillen in gedrag willen kijken. Hoewel de tracks een positie per seconde hebben, zullen de meeste punten relatief kleine verschillen hebben. Voor verdere analyse moeten we de tracks mogelijk reduceren tot een punt per 5 of 10 seconden. Door de korte tijd tussen twee punten is er een sterke temporele autocorrelatie.

We gebruiken als ondergrens 60 seconden voor de duur van de track. Indien we de tracks per seconde kunnen gebruiken zijn dit minstens 60 punten. Dat komt overeen met minstens 12 (1 punt per 5 seconden) of 6 punten (1 punt per 10 seconden). We kijken in eerste instantie enkel naar de tracks die door de automatische classificatie als een vogel aangegeven zijn. We stellen vast dat bij de kortere tracks het vaker om een verkeerde indeling gaat (tabel 2.6). 95% van de tracks zijn hoogstens 3,5 minuten lang (fig. 2.1).

Tabel 2.6: Ruwe indeling in duur per klasse.
klasse manueel < 30 sec 30-60 sec >60 sec
FLOCK enkel automatisch 76.6% 17.4% 6.0%
FLOCK geen vogel 48.8% 29.0% 22.2%
FLOCK vogel 47.8% 28.2% 24.0%
MEDIUM_BIRD enkel automatisch 75.5% 16.3% 8.1%
MEDIUM_BIRD geen vogel 72.8% 18.6% 8.7%
MEDIUM_BIRD vogel 25.0% 25.3% 49.7%
SMALL_BIRD enkel automatisch 71.5% 18.7% 9.9%
SMALL_BIRD geen vogel 58.5% 24.8% 16.7%
SMALL_BIRD vogel 24.5% 26.6% 48.9%
Histogram van de duur per tracks voor alle tracks die minstens 60 seconden lang zijn. De verticale stippellijn geeft 95% van de tracks aan.

Figuur 2.1: Histogram van de duur per tracks voor alle tracks die minstens 60 seconden lang zijn. De verticale stippellijn geeft 95% van de tracks aan.

Behalve de lengte van de track kunnen we tevens kijken naar de luchtsnelheid van de track. Vogels hebben een minimale snelheid nodig om in de lucht te blijven. Anderzijds hebben ze een topsnelheid waar ze niet boven kunnen. Momenteel weerhouden we enkel tracks met een luchtsnelheid tussen 5 en 30 m/s (18 en 108 km/u). Het aantal tracks sneller dan 30 m/s is verwaarloosbaar klein (fig. 2.2). Ongeveer 1% van de tracks is trager dan 5 m/s. Slechts zes van de manueel gecontroleerde tracks zijn vogels waarbij de snelheid trager dan 5 m/s was.

Histogram van de luchtsnelheid (in m/s) volgens de radar voor tracks van minstens 1 minuut.

Figuur 2.2: Histogram van de luchtsnelheid (in m/s) volgens de radar voor tracks van minstens 1 minuut.

In tabel 2.7 geven we per soort aan welke fractie van ruwe tracks aan deze criteria voldoet. De categorie MEDIUM BIRD omvat alle ruwe tracks met automatische categorie MEDIUM BIRD die niet manueel gecontroleerd werden. Alle andere rijen in de tabel zijn manueel gecontroleerde tracks.

Tabel 2.7: Tabel 2.8: Aantal ruwe tracks die voldoen aan de minimale criteria. Verhouding geeft het aandeel tracks van minstens 60 seconds met luchtsnelheid tussen 5 en 30 m/s.
soort totaal import verhouding
MEDIUM_BIRD 80304702 5934204 7.4%
zilvermeeuw 1996 941 47.1%
kokmeeuw 1370 491 35.8%
houtduif 1231 294 23.9%
geen vogel 895 61 6.8%
schip 668 161 24.1%
buizerd 584 293 50.2%
gierzwaluw 583 160 27.4%
kauw 493 88 17.8%
grauwe gans 491 96 19.6%
regen 404 0 0.0%
kraan 349 40 11.5%
boerenzwaluw 345 28 8.1%
kleine mantelmeeuw 323 166 51.4%
kievit 301 83 27.6%
kolgans 281 79 28.1%
zwaluw 274 35 12.8%
vleermuis spec 273 104 38.1%
lijster 252 122 48.4%
eend spec 199 101 50.8%
zangvogel 190 89 46.8%
vink 173 48 27.7%
koperwiek 163 72 44.2%
veldleeuwerik 159 42 26.4%
wilde eend 150 50 33.3%
gans spec 147 60 40.8%
spreeuw 143 30 21.0%
grote meeuw 115 65 56.5%
aalscholver 109 38 34.9%
zwartkopmeeuw 100 31 31.0%
zanglijster 83 42 50.6%
holenduif 71 18 25.4%
vogel spec 64 27 42.2%
ooievaar 57 13 22.8%
zwarte kraai 51 12 23.5%
windturbine 50 6 12.0%
slechtvalk 47 20 42.6%
gewone dwergvleermuis 46 3 6.5%
kleine vogel 44 17 38.6%
bruine kiekendief 43 14 32.6%
smient 41 14 34.1%
watersnip 37 2 5.4%
blauwe reiger 32 10 31.2%
canada gans 27 6 22.2%
huiszwaluw 26 7 26.9%
havik 23 11 47.8%
duif spec 22 7 31.8%
nijlgans 20 8 40.0%
sperwer 20 12 60.0%
lepelaar 19 5 26.3%
voertuig 19 6 31.6%
gebouw 18 3 16.7%
graspieper 18 6 33.3%
kleine meeuw 16 13 81.2%
kramsvogel 16 8 50.0%
torenvalk 16 4 25.0%
stormmeeuw 15 9 60.0%
oeverzwaluw 14 2 14.3%
wulp 14 4 28.6%
grote zilverreiger 12 5 41.7%
boomvalk 10 9 90.0%
wespendief 9 6 66.7%
wintertaling 8 2 25.0%
meerkoet 6 4 66.7%
scholekster 6 2 33.3%
boomleeuwerik 5 3 60.0%
grote lijster 5 2 40.0%
balonnetje 4 3 75.0%
goudplevier 4 2 50.0%
keep 4 0 0.0%
krakeend 4 0 0.0%
reiger spec 4 2 50.0%
rietgors 4 0 0.0%
rode wouw 4 0 0.0%
slobeend 4 1 25.0%
brandgans 3 0 0.0%
openstaande brug 3 2 66.7%
rosse vleermuis 3 0 0.0%
witte kwikstaart 3 2 66.7%
bergeend 2 1 50.0%
grutto 2 0 0.0%
middelgrote vogel 2 1 50.0%
uil spec 2 1 50.0%
visarend 2 2 100.0%
grote zaagbek 1 0 0.0%
houtsnip 1 1 100.0%
knobbelzwaan 1 1 100.0%
putter 1 0 0.0%
raaf 1 0 0.0%
visdief 1 1 100.0%

2.2 Gestandaardiseerde tracks

De tracks bevatten ongeveer elke seconde een punt. We zetten de tracks om naar tracks met vaste tijdsintervallen. We gebruik hiervoor een lineaire interpolatie op basis van de waargenomen posities. Wanneer de originele track posities bevat met minder dan 0.9 seconde tussentijd1, dan verwijderen we beide posities. Wanneer de snelheid over de grond groter is dan 30 meter per second is, de wijziging in richting groter dan 157.5°, of de tijd tussen twee punten groter dan 5 seconden, splitsen we de tracks tussen deze twee punten. We weerhouden enkel de delen die minstens 60 seconden duren.

Aantal ruwe tracks opgedeeld per aantal bruikbare tracks met vaste intervallen dat de ruwe track oplevert.

Figuur 2.3: Aantal ruwe tracks opgedeeld per aantal bruikbare tracks met vaste intervallen dat de ruwe track oplevert.

35.2% van de ruwe tracks blijken minstens een bruikbare track met vaste intervallen op te leveren (fig. 2.3). Gemiddeld resulteert een bruikbare ruwe track in 1.11 tracks met vaste tijdsintervallen.

2.3 Kans op bruikbare gestandaardiseerde tracks in functie van generieke kenmerken

Het standaardiseren van een individuele track gebeurt op zicht relatief snel. Het grote aantal tracks zorgt ervoor dat de volledige omzetting veel tijd vraagt. Om tijd en kosten uit te sparen, kunnen we overwegen om te starten met de ruwe tracks met voldoende potentie.

We beschouwen in eerste instantie enkel de relevante tracks. Deze voldoen aan volgende voorwaarden:

  • Ofwel manuele identificatie als vogel, ofwel automatische classificatie als MEDIUM_BIRD.
  • Minimale duur van 1 minuut.
  • Gemiddelde snelheid tussen 5 en 30 meter per seconde.

Vervolgens kijken we of we minstens één track met gelijke tijdsintervallen overhouden. In dat geval beschouwen de ruwe track als bruikbaar. Wegens het grote aantal relevante tracks loont het de moeite om na te gaan welke eenvoudig te berekenen kenmerken een invloed hebben om de kans om een bruikbare track op te leveren. We beschouwen volgende kenmerken:

  1. Verhouding tussen de oppervlakte van de convex schil (convex hull) en de lengte van de track. Hoe kleiner de verhouding, hoe kleiner het gebied dat de track bestrijkt in verhouding tot de lengte van de track.
  2. Hoogteverschil tussen het hoogte en laagste punt van de track.
  3. Midden hoogte: het gemiddelde van de kleinste en grootste hoogte van de track.

Uit de dataverkenning kunnen we al een eerste inschatting maken van de effecten.

  • Bij een lage verhouding van de oppervlakte van de convexe schil en de lengte van de track is de kans klein op bruikbare tracks (fig. 2.4 en 2.5).
  • Naarmate het hoogteverschil binnen de track groter is, stijgt de kans op een bruikbare track (fig. 2.6).
  • De midden hoogte vertoont een maximum rond de 300 tot 500 m (fig. 2.7). Boven 1000 m is het effect onstabiel, deels door het beperkt aantal tracks.
  • Op basis van de combinatie van de verhouding en het hoogteverschil krijgen we de indruk dat beide een ondergrens vertonen (fig. 2.8).
  • De combinatie van verhouding en midden hoogte lijkt een optimale gebied te suggereren bij hoge verhouding en midden hoogte onder de 750 m (fig. 2.9).
  • De combinatie van verhouding en midden hoogte lijkt een optimale gebied te suggereren bij een midden hoogte onder 750 m en een hoogteverschil boven 100 m (fig. 2.9).

We voeren deze analyse uit op alle relevante tracks die we gestandaardiseerd hebben. In eerste instantie hebben we een aselecte set van relevante tracks gestandaardiseerd die de beschikbare variabiliteit van de drie kenmerken volledig dekt. Deze set liet toe om een eerste analyse uit te voeren. In tweede instantie hebben we ons beperkt tot de relevante tracks met een verhouding groter dan 1 en een hoogteverschil van groter dan 10 m. Omdat we relatief weinig tracks op lage hoogte hebben, zijn we in eerste instantie met deze tracks gestart. De grootte van de punten in de figuren is relatief ten opzicht van het aantal gestandaardiseerde tracks met die kenmerken. De zone met grotere punten geeft inzage in het verloop van de standaardisatie. Momenteel hebben we van de 5938434 relevante tracks 22.5% gestandaardiseerd. Dit leverde 171791 bruikbare gestandaardiseerde tracks op.

Aandeel bruikbare tracks i.f.v. de verhouding van de oppervlakte van de convex hull en de lengte van de track.

Figuur 2.4: Aandeel bruikbare tracks i.f.v. de verhouding van de oppervlakte van de convex hull en de lengte van de track.

Aandeel bruikbare tracks i.f.v. de de oppervlakte van de convex hull en de lengte van de track.

Figuur 2.5: Aandeel bruikbare tracks i.f.v. de de oppervlakte van de convex hull en de lengte van de track.

Aandeel bruikbare tracks i.f.v. het hoogteverschil van de track.

Figuur 2.6: Aandeel bruikbare tracks i.f.v. het hoogteverschil van de track.

Aandeel bruikbare tracks i.f.v. de hoogte in het midden van het laagste en het hoogste punt van de track.

Figuur 2.7: Aandeel bruikbare tracks i.f.v. de hoogte in het midden van het laagste en het hoogste punt van de track.

Aandeel bruikbare tracks i.f.v. de verhouding van de oppervlakte van de convex hull en de lengte van de track en het hoogteverschil van de track.

Figuur 2.8: Aandeel bruikbare tracks i.f.v. de verhouding van de oppervlakte van de convex hull en de lengte van de track en het hoogteverschil van de track.

Aandeel bruikbare tracks i.f.v. de verhouding van de oppervlakte van de convex hull en de lengte van de track en de middenhoogte van een track.

Figuur 2.9: Aandeel bruikbare tracks i.f.v. de verhouding van de oppervlakte van de convex hull en de lengte van de track en de middenhoogte van een track.

Aandeel bruikbare tracks i.f.v. het hoogteverschil van de track en de middenhoogte van de track.

Figuur 2.10: Aandeel bruikbare tracks i.f.v. het hoogteverschil van de track en de middenhoogte van de track.

In fig. 2.11 geven we de voorspelde kans op een bruikbare track weer in functie van de verhouding tussen de oppervlakte van de convexe schil en de lengte van de track, het hoogteverschil en de midden hoogte van de track. We hebben de hoogste kans op een bruikbare track wanneer de verhouding tussen 25 en 1000 is, het hoogteverschil minstens 10 m is en de midden hoogte onder de 800 m blijft.

Voorspeld aandeel bruikbare tracks i.f.v. de verhouding van de oppervlakte van de convex hull en de lengte van de track, het hoogteverschil van de track. Opgesplitst volgens de middenhoogte van de track.

Figuur 2.11: Voorspeld aandeel bruikbare tracks i.f.v. de verhouding van de oppervlakte van de convex hull en de lengte van de track, het hoogteverschil van de track. Opgesplitst volgens de middenhoogte van de track.


  1. in de praktijk vaak minder dan 0.1 seconde↩︎

 

Creative Commons-Licentie Onkelinx, T. & Carmen, R. (2024). 10.21436/inbor.114415092