x

Re: OutScout.org ist jetzt offiziell online


Geschrieben von wambacher (Gast) am 07. Februar 2013 14:51:12: [flux]

Als Antwort auf: OutScout.org ist jetzt offiziell online geschrieben von chrisMein (Gast) am 05. Februar 2013 16:49:

Netzwolf wrote:

Oder gleich auf “^https?://” im Value abfragen.

na ja, kommt ja so einiges rüber. Hier mal ne Stichprobe aus 1 Mio tags:

SELECT␣key,␣count(*)␣FROM
(SELECT␣(each(tags)).*␣FROM␣nodes
limit␣1000000
)␣AS␣stat
where␣value␣like␣'http://%'
GROUP␣BY␣key
ORDER␣BY␣count␣DESC,␣key;
key␣␣␣␣␣␣␣␣␣␣␣|␣count
------------------------+-------
website␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣4379
source␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣1524
memorial:website␣␣␣␣␣␣␣|␣␣␣573
url␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣358
contact:website␣␣␣␣␣␣␣␣|␣␣␣205
image␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣88
wikipedia:de␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣24
website:official␣␣␣␣␣␣␣|␣␣␣␣21
url:webcam␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣20
wikipedia␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣13
note:de␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣9
source_ref␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣9
url:official␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣9
website_photo␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣5
attribution␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣4
harbour:web␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣4
note␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣4
link␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣3
b5m:url␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣2
b5m:urlOrto␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣2
contact:email␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣2
contact:url␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
contact:webcam␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
fixme␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
heritage:website␣␣␣␣␣␣␣|␣␣␣␣␣1
internet_access␣␣␣␣␣␣␣␣|␣␣␣␣␣1
network␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
operator␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
Photo:url␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
population_ref␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
price␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
source:details␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
source:file␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
source:name␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
source:population␣␣␣␣␣␣|␣␣␣␣␣1
source:url␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
url2␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
url:myth␣␣␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
website:de␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣␣␣1
website:unofficial␣␣␣␣␣|␣␣␣␣␣1
wheelchair:description␣|␣␣␣␣␣1
wheelchair:source␣␣␣␣␣␣|␣␣␣␣␣1
(42␣rows)

ist ziemlicher Müll dabei. Da wäre mir das schon lieber:

SELECT␣key,␣count(*)␣FROM
(SELECT␣(each(tags)).key␣FROM␣nodes
limit␣1000000
)␣AS␣stat
where␣key␣in('url','website','contact:website')
GROUP␣BY␣key
ORDER␣BY␣count␣DESC,␣key;
key␣␣␣␣␣␣␣|␣count
-----------------+-------
website␣␣␣␣␣␣␣␣␣|␣␣5194
contact:website␣|␣␣␣389
url␣␣␣␣␣␣␣␣␣␣␣␣␣|␣␣␣262
(3␣rows)

Gruss
walter