The end of an era

May 10th, 2011 2 comments

Too early and unnecessarily you had to go (i.e. you had been “let go” by someone).

Office door of Stimme and me

Ritter Sport

January 15th, 2011 No comments

Man soll ja nicht immer nur meckern, deswegen zur Abwechslung auch mal ein Lob: Ich hatte bei Ritter Sport über Weihnachten selbstkreierte Tafeln Schokolade bestellt, sahen auch super aus. Allerdings hat die Lieferung ziemlich lange gedauert (über einen Monat iirc). Heute bekomme ich ein Paket von Ritter Sport, ohne bestellt zu haben:

Als Entschädigung für die Wartezeit unaufgefordert sechs große Tafeln Schokolade und acht kleine, das finde ich dann doch wirklich mal kundenfreundlich, deswegen hier auch mal die positive Erwähnung eines Unternehmens ;). Und vielen Dank dafür.

My take on GTD (getting things done)

November 30th, 2010 No comments

After coming back from my trip to Cuba, my inbox was pretty filled, as usual. But even after sorting out there were almost 70 emails left (not counting newsletters), that were still important in one way or another. And I noticed that I actually missed some stuff that was supposed to be finished already. This was when I decided, that using your inbox (+labels) wasn’t enough anymore to stay ahead of your work, if you have a job situation and personal projects similar to mine (research assistant). A colleague told me that he is using the method of Getting Things Done (GTD) by David Allen.

The gist of it is: Whenever you get an email (or anything else) do it immediately if it can be done fast, delete or delegate it, or file a task of it to be done when you have time for it. This way, you can concentrate on the task ahead while you can free your mind of currently unnecessary occupations. Now, with due-dates and priorities you can go to through your tasks step by step, always having exactly one goal in mind (of course this is a shortened version of the system, see google or wikipedia or the book for details).

So I started to convert my emails to tasks and actually liked that a lot. I wouldn’t miss important things anymore just because they were lost in my inbox somewhere and I could make a list of “next tasks” to focus on. Additionally, this is extremely well supported in, and there was a nice android app named got to do with full synchronisation support. However, that was still not the optimal solution. While it drastically improved the organization of work and helped with having an overview of the total amount of work to be done, I got lost fast due to the amount of tasks (75 currently) and I almost lost more time organising tasks than actually doing work. The main issue is on how to sort your tasks, my colleague used a different system than I, and we both were using different systems than David Allen. None of them was really fitting in my opinion.

David Allen’s system isn’t really suitable imho, if you have a lot of “private” taks (in my case, most of them stemming from my dissertation, as well as private projects) and you are not assigned to a small number of specific projects; I can’t make a specific project for every task, as in my job there are dozens of very different assignments. So I used a number of general projects like “work (general)”, “dissertation”, “teaching”, “project proposals”, “private projects” etc. And using due date for sorting tasks isn’t working either, as most points of my dissertation don’t have specific due dates – so will never be on top of the list and thus never be a “next task”. Manual sorting isn’t really cutting it either and priorities are too inflexibel. After about two weeks of using the system, I think I found a way which is somewhat suitable (and much better compared to simple note systems or just emails):

  • Every Sunday I sort out all tasks I want to finish next week and file them under the status of “next task”
  • All tasks get due dates; in case of unspecific tasks e.g. regarding my thesis, they get due dates when I want to have those finished at the latest. Task not to be done within the next week are marked as “active”
  • All other tasks, where I have not yet decided on a due date but need to be done are marked “planning”
  • Everything else which I just want to do when I’m in the mood or when there’s plenty of time (like learning something new) is marked as “someday”
  • I use priorities to sort tasks having the same due date, but that’s just a bonus
  • The order of sorting in Toodledo is thus: status → due date → priority (without pro subscription only two criteria are allowed, however that’s not a big deal)

I have two additional tips for the use with toodledo:

  • When using gmail, it’s easy to link tasks with permalinks. Just paste the gmail url and replace #mbox with #all, e.g.:
  • The stylish or greasemonkey plugin has a really nice layout enhancement for toodledo:
  • If you have the pro subscriptions, you can use subtasks, to avoid having to many projects/folders; all projects that are short-lived and have a small number of tasks (maybe three) are filed using subtasks instead of folders.

If you are using GTD or toodledoo, too, or have a job situation similar to mine, please let me know of your experiences, how you organise yourself or what way of sorting you prefer. I’d be really interested in that.

Eben mal Altpapier wegbringen…

November 23rd, 2010 No comments

…ist nicht erlaubt, wenn Nachbars Katze in der Nähe ist.

Katze im Karton

Rollins Band – Illumination

August 19th, 2010 No comments

Illumination comes so hard
Makes me see but leaves its scars
At times I wish that I didn’t know what I know now
Thought and thought until I lost my mind
Looked and looked until I went near blind
The path is fair but so unkind

Video (bad quality, unfortunately):

Rollins Band – Illumination

That’s what you get for wanting to work at home for once…

August 13th, 2010 1 comment
Die Blogosphäre und Blumenkübel

August 6th, 2010 1 comment

Dies wird ein kurzer, unstrukturierter Rant aus gegebenem Anlass. Es gibt einen, unter Bloggern sehr verbreiteten Typ Menschen, der von sich behauptet eigentlich eine sehr positive Lebenseinstellung zu haben, um dann gleich darauf irgendetwas Negatives zu schreiben. Und zwar in so ziemlich jedem Beitrag.

Gestern verbreitete sich das Blumenkübel-Mem auf Twitter, wo auch ich mitgemacht habe. Ansich ein harmloser Spaß, den man mögen mag oder auch nicht. Aber, und damit hätte ich rechnen sollen, sofort kamen wieder jede Menge Beiträge von Bloggern des oben erwähnten Typus. Diese wetterten natürlich sofort unisono, dass sich die Twitterer mal wieder lustig machen über andere und sich über diese erheben, ob der politisch doch irrelevanten Meldung. Natürlich nicht ohne den Hinweis, dass sich die Twitterer somit wichtiger machen als andere, was einer gewissen Ironie nicht entbehrt.

Ich und bestimmt >90% der darüber twitternden Leute hatten mit Sicherheit weder vor, damit ein politisches Statement zu machen, uns über die berichtende Praktikantin oder Zeitung lustig zu machen, noch hier Medienkritik zu betreiben. Eine Nachricht an die Blogger: Manchmal, ja manchmal macht man auch einfach etwas völlig unkritisch aus Spaß. Den man teilen kann oder auch nicht (und auch nicht muss). Daraus eine Überheblichkeit abzuleiten, spricht aus meiner Sicht nur für die eigene Überheblichkeit, sich ja von der Masse distanzieren zu müssen und sich, oftmals aufgrund der mittlerweile verkommenen Fähigkeit, einfach mal völlig unpolitisch an etwas ranzugehen, zu mockieren.

Natürlich kann man die Aktion politisch deuten. Und natürlich wird man, wenn man von seinem hohen Roß mal runter kommt, auch sehen können, dass es in der Gesamtheit schlichtweg nicht politisch zu deuten ist und auch nie beabsichtigt war – was dann allerdings einen Rant weniger bedeuten würde, in dem man sich von den anderen distanzieren kann bzw. aus der Gewohnheit ausbrechen müsste. Beides muss nicht sein. Wenn man nicht mitmachen will, macht man nicht mit; wenn man nicht versteht, dass nicht alles eine tiefere Bedeutung hat, dann sollte man seine Einstellung vielleicht überdenken.

Manchmal ist Spaß einfach nur Spaß, in diesem Sinne: “Einfach mal locker durch die Hose atmen” 😉

Immer gut, nicht nur eine Quelle zu lesen

April 6th, 2010 No comments
How not to review scientific papers

March 5th, 2010 No comments

This year a scientific conference will take place, where me and a number other colleagues of our department submitted papers to. A double-blind review process was selected for this conference, meaning that two independent reviewers will evaluate and give marks for papers. This is (in theory) a good process. Often times the reviews are helpful for the authors, even when their papers are not accepted, and the overall quality of the conference is somewhat ensured. Now, I got back some of the some worst reviews I ever read – not because my papers got rejected (one got accepted) – but because of the review comments. Some colleagues asked me whether to take such reviews seriously and I asked some of them myself. I’d like to share my thoughts about this with you and I’m pretty sure you will agree.

I was (co-)author of two different papers. Since I knew there were a high number of submission, acceptance was not guaranteed, but I was eager to see the reviews, which often proved very helpful on other conferences. These were the actual reviews we got:

Clearly exceeds 400-word limt for abstract.
Very interesting innovative approach on participatory planning software. Once
up and running, I would like to learn more about experiences with the
implementation. (5/10)

At least this review had one hint, that the reviewer actually read the paper. But clearly exceeds 400-word limit? Our abstract had (including date and title) 394 words → FAIL

may be rejected (4/10)

may be rejected? Oh really? That’s so helpful, who needs reasons anyway? My grandmother probably could have written a better review, and she surely isn’t able to read English scientific papers → FAIL

Now to the second paper, which was actually accepted:

In order to properly compare companies as a whole on a higher level, the
authors suggest to a) aggregate key performance indicators towards a single
evaluation value and b) to assign different weights to indicators based on
stakeholder input.
The new models need to be summarized more clearly. (9/10)

Ok, this is actually the best review (which is quite sad), because it shows the reviewer at least read it. Also, he/she gives one hint, which is not really helpful (in a full paper it’s much easier to clearly present the approach compared to a 400-word abstract), but at least it’s something. In other conferences this review would be fail, but now my standards are so low already, I’ll say it’s acceptable. Not to worry though, there’s another review:

good paper (8/10)

Gee, thanks! This is such a reasonable, well structured review. What can I say? Oh yes → FAIL

One of the foundations of scientific method is to have results written down in an understandable (reproducible) order. This conference had more submission than expected, granted. But having this review process is just utterly pointless – you can’t even tell if the reviewers at least had a look at your paper. For what it’s worth: Most of the papers accepted here had some professor titles as authors – this doesn’t necessarily mean anything, but just a hint on another big problem of current science – titles are more important than content.
Overall, this feedback just leaves a very shallow taste whether the conference (or at least the reviewers) can be taken seriously. The conference hasn’t even started and already leaves an unprofessional impression. Let’s hope, the actual presentations and final papers will make up for this.

“Das NBL beruht auf der Gleichverteilung der Mantissen der Logarithmen der Zahlenwerte des Datensatzes”

June 18th, 2009 No comments

Heise hat gestern einen Artikel veröffentlicht, in dem von Wahlfälschungen bei der Iranischen Wahl die Rede ist (gefällt mir; andere sprechen immer schön euphemistisch von “Unregelmäßigkeiten”). Diese werden begründet durch statistische Analysen mittels des Newcomb-Benford’s Law (NBL). Dieses Gesetz finde ich hochinteressant, ist allerdings länger her, dass ich mir das angeschaut hatte. Was ist zu tun in diesem Fall? -> ganz klar, Wikipedia aufrufen. Entgegen meiner Gewohnheit habe ich die deutsche Wikipedia genutzt. Folgendermaßen wird das NBL erklärt:

Das NBL besagt, dass die Auftretenswahrscheinlichkeiten der Ziffernsequenzen in den Zahlen von realen Datensätzen (damit sind hier solche gemeint, die keinen Manipulationen unterlagen) genügend umfangreich sind und Zahlen in der Größenordnung von x bis mindestens 10000 x aufweisen. Daten also, welche einigermaßen weit verteilt (dispergiert sind), nicht gleichverteilt sind, sondern logarithmischen Gesetzen folgen. Das bedeutet, dass die Auftretenswahrscheinlichkeit einer Ziffernsequenz umso höher ist, je kleiner sie wertmäßig ist und je weiter links sie in der Zahl beginnt. Am häufigsten ist die Anfangssequenz ‚1‘ mit theoretisch 30,103 %. Das NBL beruht auf der Gleichverteilung der Mantissen der Logarithmen der Zahlenwerte des Datensatzes. Der Grund für das erstaunlich häufige Gelten des NBL liegt an dem Umstand, dass viele reale Datensätze log-normalverteilt sind, nicht also die Häufigkeiten der Daten selbst, sondern die Häufigkeiten der Logarithmen dieser Daten einer Normalverteilung folgen. Bei genügend breiter Dispersion der normalverteilten Logarithmen (wenn die Standardabweichung größer/gleich etwa 0.74 ist) kommt es dazu, dass die Mantissen der Logarithmen stabil einer Gleichverteilung folgen. Ist die Standardabweichung allerdings kleiner, sind auch die Mantissen normalverteilt, und das NBL gilt nicht mehr, zumindest nicht mehr in der dargestellten einfachen Form. Ist die Standardabweichung kleiner als 0.74, kommt es zu dem in der Statistik nicht allzu häufigen Effekt, dass sogar der jeweilige Mittelwert der Normalverteilung der Logarithmen die Auftretenshäufigkeit der Ziffernsequenzen beeinflusst. Geht man einerseits vom NBL in der heutigen Form aus, so existieren zahlreiche Datensätze, die dem NBL nicht genügen. Andererseits gibt es bereits eine Formulierung des NBL in der Form, dass ihm sämtliche Datensätze genügen. Die Formulierung des „allgemeinen NBL“ ist wesentlich komplexer und enthält die bekannte Form des NBL als Grenzverteilung. Ihre Darstellung würde den Rahmen dieser Seite sprengen.

Das Benfordsche Gesetz gilt insbesondere für Zahlenmaterial, das natürlichen Wachstumsprozessen unterliegt. Dann nämlich verändern sich die Zahlen im Laufe der Zeit und verzehnfachen sich. Die erste Position der Mantisse verharrt für ca. 30% der Zeit auf der 1, 18% der Zeit auf der 2 usw: Das entspricht der logarithmischen Verteilung, die das benfordsche Gesetz vorhersagt und ist unabhängig von der Zeit in der eine Verzehnfachung erfolgt. Dann beginnt der Zyklus von Neuem bei der 1. Bei einer Momentaufnahme der Preise eines Supermaktes, wird man genau diese Verteilung finden, egal wann die Erhebung durchgeführt wird.

Quelle: (Autoren und Lizenz auf der Seite)

WTF?! Ich möchte mal wissen, wer das kapieren soll, der das Gesetz nicht schon kennt oder Mathematik studiert. Nun ist die englische Wikipedia in diesem Fall auch nicht viel einfacher zu verstehen, aber folgender Absatz war doch hilfreich:

A simple example may help clarify how this works. To say that a quantity is “growing exponentially” is just another way of saying that its doubling time is constant. If the quantity takes a year to double, then after one more year, it has doubled again. Thus it will be four times its original value at the end of the second year, eight times its original value at the end of the third year, and so on. Suppose we start the timer when a quantity that is doubling every year has reached the value of 100. Its value will have a leading digit of 1 for the entire first year. During the second year, its value will have a leading digit of 2 for a little over seven months, and 3 for the remaining five. During the third year, the leading digit will pass through 4, 5, 6, and 7, spending less and less time with each succeeding digit. Fairly early in the fourth year, the leading digits will pass through 8 and 9. Then the quantity’s value will have reached 1000, and the process starts again. From this example, it’s easy to see that if you sampled the quantity’s value at random times throughout those years, you’re more likely to have measured it when the value of its leading digit was 1, and successively less likely to have measured it when the value was moving through increasingly higher leading digits.

This example makes it plausible that data tables that involve measurements of exponentially growing quantities will agree with Benford’s Law. But the Law also appears to hold for many cases where an exponential growth pattern is not obvious.
Quelle: (Autoren und Lizenzen auf der Webseite)

Im Prinzip geht es also darum, dass bei konstanter Verdopplungszeit der Sprung von 1 auf 2 genauso lange braucht wie von 2 nach 4, so dass etwa die 3 kürzer bzw. seltener aufzutreffen ist als die 1,5 (weil im ersten Fall in der gleichen Zeit nur halb so viele Werte zu durchlaufen sind wie von 2 nach 4 oder ein Viertel von 4 bis 8). Geht doch. Die “Gleichverteilung der Mantissen der Logarithmen der Zahlenwerte des Datensatzes” geht mir in diesem Fall sonstwo vorbei. Dieser Satz taugt zwar zur Erheiterung, aber nicht zur Erklärung.

Deutsch ist meine Muttersprache. Auch wenn mein Englisch sicherlich verhältnismäßig gut ist, so wird es bei vielen Sachen vermutlich immer einfacher sein, mich in Deutsch auszudrücken. Dennoch ist es so, dass ich Computerrelevantes seit langem fast ausschließlich in Englisch mache. Ein paar weitere Beispiele:

  • Mein Betriebssystem (Ubuntu) ist auf Englisch eingestellt. Der Grund ist einfach: Wie mit jeder großen Software gibt es Probleme, die gelöst werden müssen. Die deutsche Community um Ubuntu ist recht groß, aber das offizielle Forum und vor allem Bug-Reports sind auf englisch. Um ein Problem zu beheben kommt man deswegen mit den englischen Originalbegriffen deutlich schneller ans Ziel. Davon abgesehen finde ich die englischen Bezeichnungen oft eingängiger.
  • In Google suche ich mittlerweile nur noch auf Englisch; hier ist der Wechsel anfangs sicherlich schwieriger, weil man sich halbwegs sicher mit den passenden Begriffen sein muss. Wenn man aber erstmal so weit ist, dass die Suchbegriffe ähnlich gut wie im Deutschen sind, kommt schon alleine ein quantitativer Sprung hinzu: Es gibt einfach wesentlich mehr im Englischen zu finden als im Deutschen.

Letzter Punkt ist im Prinzip wesentlich dafür, dass Recherchen im Internet i.d.R. im Englischen bessere Ergebnisse erbringen; viele Menschen schreiben und unterhalten sich in ihrer Muttersprache und in Englisch (s. diese Blog), so dass Englisch, auch als internationale Sprache, wesentlich stärker vertreten ist als eine einzelne andere Sprache. Die Qualität des Geschriebenen ist dadurch im Schnitt nicht besser als in Sprachen, in denen weniger veröffentlicht wird (s. wieder dieses Blog 😉 ), aber ein anderer Effekt tritt auf: Suchmaschinen wie Google mit ihrem PageRank-Algorithmus sind mittlerweile einigermaßen gut dazu in der Lage, die besten Suchergebnisse zu finden und entsprechend zu platzieren, so dass die ebenfalls große Menge schlechter Suchergebnisse nicht dargestellt wird.

Durch diesen Ansatz wirkt sich letztlich Quantität auch positiv auf die Qualität aus, da schlechte Beiträge in den Nirwanas der Suchmaschinenfilter verschwinden. Ein weiterer Grund, die englische Grundbildung in unserer Gesellschaft wesentlich stärker zu betonen, als es momentan der Fall ist.

