私は、Tweets/SMS/Identica またはその他の短いテキスト ステータス更新システムを使用して Observations of Daily Living (または ODL) を追跡するというアイデアに興味があります。基本的な概念は、ステータスの更新を Twitter や Identi.ca に送信するか、SMS メッセージなど、後でパターンを示すためにマイニングできる形式で送信することです。
エクササイズ、ダイエット、映画の好みなど、好きなことを追跡するために使用できます。
これを行うには、人間とコンピューターの両方がステータスの更新を簡単に解析できる構文が必要です。構文は、少ない文字数をサポートしながらも人間が読める密度の高いものにする必要があります。
このアイデアは新しいものではなく、運動や食生活を追跡するための Twitter アプリがたくさんあります。Twitter はすでに基本的に短いテキストの ODL メディアであり、#feeling http://search.twitter.com/search?q=%23feelingで検索し たり、#hurt http://search.twitterで検索したりすることで簡単に確認できます。 .com/search?q=%23hurtsまたは豊富な ODL データのマイニングを目的としたアプリケーションは、すでに Twitter に投稿されています: http://www.tweetfeel.com/
Twitter を使用して ODL を追跡することにより、Google Health や HealthVault など、そのためだけに作成された特定の統合エンジンを人々に使用させるための戦いをやめ、代わりに、人々が既に使用している ODL 追跡システム (Facebook など) の価値を向上させることに集中できます。またはツイッター。ただし、そのためには、ODL を入力し、それらのエントリをデータ マイニングするための一般化可能なアプローチが必要です。これにより、より高いレベル、または少なくとも異なるレベルで意味を理解できるようになります。
Twitter を使用して好きなものを追跡する方法を一般化するために使用できる構文もいくつかあります。これらは私が最も興味を持っているものです。これまでのところ、いくつか知っています:
Daytum には twitter 構文があります。ダイレクト メッセージを使用し、次のようになります。
d daytum item : amount
// simple data label and value
d daytum item [category, category] : amount
// same thing but with tagging...
Your.flowingdata.com には、より豊富な構文があります。また、ダイレクト メッセージを使用します。
// yfd works with "action" and "value" pairs
d yfd weigh 160
d yfd exercised arms
d yfd watched Back to the Future
// but can be made more complex with units
d yfd drank 2 water
d yfd drank 1 coke
// and timestamps
d yfd played xbox at 20:00
d yfd goodnight at 11:00pm
d yfd goodnight at 11pm
アクションごとに、yfd はデータ型に関するいくつかの情報を尋ね、次のいずれかを選択するように求めます。
カテゴリー - トウモロコシを食べたなど、異なる単位で同じアクションが発生することに関心がある場合 イベント - おやすみやうんちなど、何かが起こったときに関心がある場合 カウンター - 行った合計回数に主に関心がある場合何か 例: たばこを 5 本吸った 測定 - 体重 160 や血圧 170 など、ある値の経時的な傾向を確認したい場合
かなり賢いですよね?
私が知っている最後のものは、Grafitter 構文です。これまでのところ、ハッシュタグを非常に巧妙な方法で使用しているため、これは非常に優れたコンセプトです...
//hashtag with comma separated tags
#mood(happy,elated,drunk)
#mood(sad,sober)
// scales, like not busy
#busy(1)
// very busy
#busy(5)
//straight up numbers
#lbs(250)
#worked(10)
食べたものはDMでもつぶやき、食べたものはもちろん、カロリー・脂質・ポイントなどもつぶやくことができます。したがって、構文は次のようになります
d tyeats #breakfast One bowl of cereal *c500
// the *c500 marks the tweet as 500 calories
もちろん、通常は次のようなものを生成する runkeeper など、既に Twitter にログを記録しているさまざまな ODL 生成ソフトウェアで採用されている非常に一般的な自然言語パターンに注意することが重要です。
@meattwitter Just completed a 4.50 km run with @runkeeper. Check it out! http://rnkpr.com/aaaaa #RunKeeper
それでは、私の質問は?
他に見落としている重要な ODL 構文はありますか? DM はデータ収集の正しい方法ですか、それともハッシュタグに焦点を当てる必要がありますか? runkeeper など以外に、他にどのような重要な「自然な」ODL が発生していますか? この問題 (ソーシャル メディアのステータス更新における ODL 構文) に関する正式な調査を知っている人はいますか? この種のものを実装している既存のオープン ソース プロジェクトを知っている人はいますか?
更新: Paul は、OMHE プロジェクトがこの種のことを行っていることを指摘しました。http://code.google.com/p/omhe/ここに OMHE 構文があります。これには既に Python ベースのパーサーがあります。
#The basic OMHE syntax follows this basic format"
[COMMAND_NAME]<VALUE><#[TAG]>
# Reporting WEIGHT (This is correct):
wt123.4
# In the previous example, COMMAND_NAME=wt and VALUE=123.4
# Reporting WEIGHT (Also Correct):
wt=123.4
# In the previous example, COMMAND_NAME=wt and VALUE=123.4
# Reporting WEIGHT with _TAGS_ (Also Correct) :
wt=123.4#mytag#myothertag
# The previous example has two tags: 'mytag' and 'myothertag'
# Weight is a command that requires a value (Incorrect):
wt
#You can never have an equal sign without a value. (Also Incorrect):
wt=
# Here is an OMHE string with two commands separated by white space " ".
# Says the command 'wt' (weight) has a value of '195' and blood glucose is 150.
wt195 bg=150
# Report the start of a menstrual cycle (correct):
# (Correct) mcycle is a command where value is not required
mcycle
# Report the first day of a menstrual cycle:
# Notice we can still add tags even if no value is given
mc
# Report the start of a menstrual cycle (Incorrect):
# You can't provide an equals "=" sign without a value:
mc=
# Report the adherence to a health directive such as taking medication (correct):
# (Correct) did is a command where value is not required
did
# Report the adherence to a health directive to stretch arm (correct):
did=ARMSTRETCH
# Send Blood Glucose Level:
bg125
# Send Blood Pressure:
bp100d120p65
# Send Blood Pressure using the equals sign style:
bp=100d120p65
# Send Weight:
wt145
wt=145 #Express weight using the equals sign style
w78k #Express weight in kilograms
wt145l #Explicit express weight in pounds (lbs)
wt245.8 #Express fractional weight
wt245p8 #Another way to express fractional weight
# Send blood glucose, patient identifier, a note, and the date:
bg145 id213762732467234 nAllGood d20090117
# Sending blood glucose with a simple note tag (with spaces):
bg145#I'm*feeling*very*tired*today
# Report the start of a menstrual cycle:
mcycle
# Get a copy of your health benefits/insurance card:
gethc
# Send a copy of your health benefits card to someone via fax:
sendhc=6509840982#fax
# Send a copy of your health benefits card as a pdf to someone via email:
sendhc=nurse@mydoc.com#pdf
# Get a copy of your personal health record:
getphr
# Get a copy of your personal health record as a pdf:
getphr#pdf
# Get a copy of your personal health record in CCD format:
getphr#ccd
# Send a copy of your personal health record to someone in CCR format:
sendphrnurse@mydoc.com#ccr
# Send a copy of your personal health record to someone in XML microformat:
sendphr=nurse@mydoc.com#microformat
私の目標は、オープン ソース ライセンスの下でパーサーとデータ表示ツールを作成することであり、一般的にどのような種類のものをサポートする必要があるかを探しています。そのため、そのようなプロジェクトの要件リストを作成するために私が尋ねるべきであった他の質問を考えることができる場合は、私に知らせてください!! たとえば、メンション、DM、返信などの標準的な Twitter 構文用のパーサーの適切な実装があることを私は知っています。
誰かが簡潔な方法でそれを行う方法を教えてくれない限り、当分の間、システムが「プライベート」ロギングをサポートしないと仮定して喜んでいます。