2009-06-01から1ヶ月間の記事一覧
C:\Lucene\files\にTwitterのユーザー名.txtがあり、TwitetrのPOSTが1行に1つ C:\Lucene\indexにindexを作成済み1つのユーザー名.txtから類似したユーザー名.txtを探す import java.io.File; import java.io.IOException; import java.io.Reader; import jav…
http://twitter.com/statuses/public_timeline.json ↑これとかがTwitter APIだったのかTwitter API Wiki / Twitter REST API Method: statuses public_timeline http://apiwiki.twitter.com/Twitter-REST-API-Method%3A-statuses-public_timelineということ…
mvn install:install-file -Dfile=jarまでの絶対パス -DgroupId= -DartifactId= -Dversion=バージョン -Dpackaging=jar -DgeneratePom=true
非公開にしているユーザーに催促するのを辞めた
followメソッドでコツコツ集めてるけど、量的に厳しい firehoseとか使わせてくれないかなー収集した単語はいい感じじゃないかな cnet_jのTweet CNET PC USB キャプチャ CNET 2014年 アイ ムーア 2014年 アイ CNET AD アル ブログ CNET Japan ブログ CNET Jap…
エラーログメモり忘れた 自動的に再接続させたい場合はonExceptionメソッドに何か書けばいいのかな 無理矢理mainメソッドを呼ぶとか? 格好悪い・・・ public void onException(Exception ex) { }
buzztterやふぁぼったーやつぶやいったーの人たちはどうやってTwitterのクローラを開発したんだろう? Stream AIPは最近追加されたものだから使ってないだろうし、かといってgetPublicTimeLine()じゃ漏れがあるだろうし、すぐにAPI制限にかかっちゃいそう。…
2ch用語を形態素解析したいと考えて2辞Plusの管理人様に用語一覧を頂けないかとメールをしてみた。 貰えたら嬉しいなぁ〜許可を頂けたので2ch用語追加!TwitterからStream API使わせてくれメールの返信が来ない・・・ 放置されたかな?
shadowを動かす shadowで集めるユーザーの基準を決める。投稿数1000くらい? 投稿数が一定を満たしているユーザーを集めるプログラムを作る。 そのユーザーのTweetをユーザーごとにテキストで出力するプログラムを作る。 以上が終わったらLucene動かす。間違…
MLに書いてあったやり方(typoなど修正済み)でstreamを試そうとしたらエラーが import twitter4j.Status; import twitter4j.StatusListener; import twitter4j.TwitterException; import twitter4j.TwitterStream; public class TestShadow { public static v…
今日の目標はLucene + Senを動かしてみること Senは単独で動作しているので、とりあえずはLucene単独で動かすことを目指そう。 Luceneのjavadoc org.apache.lucene.index (Lucene 2008-12-20_02-04-42 API) http://hudson.zones.apache.org/hudson/job/Lucen…
My Daily Twittascopeが気持ち悪いMy Daily TwittascopeとはTwitterのIDとパスワードを登録すると、1日1回占いを自動的にPOSTしてくれるというサービス。 理由 登録すると解除ができない DMを送ると解除してもらえるらしい。があっちがフォローしてくれない…
LuceneのjavadocはDLして解凍したフォルダのlucene-2.4.1/docs/api/index.htmlにある。とりあえずはよさげなサンプル探しだサンプルの通り下記のようにやると、使用すべきではありませんと言われる。 IndexWriter writer = new IndexWriter(index, new Japan…
Maven導入してみる Eclipse 3.4.2とm2eclipseでMavenを使ったJavaのライブラリ管理 - public static void main http://d.hatena.ne.jp/Kishi/20090228/1235813480 ここを参考にして導入してみたけど、「依存関係の追加」で失敗する。 commons-langと入力して…
タイトルの通り(1度も書いてないことに気がついた 研究 WebOTXの勉強 SIPropの勉強 そもそもSIPの勉強 Twitter関連 自分用に携帯用Twitter作成 携帯用webページについての勉強 類似ユーザー検索サービス Lucene+Sen Seasar2入門(家ではこれ ネット繋がらない…
import java.io.IOException; import twitter4j.Status; import twitter4j.StatusStream; import twitter4j.Twitter; import twitter4j.TwitterException; import twitter4j.TwitterStream; public class Test2 { public static void main(String[] args) th…
BOT同士リプライしないようにした
ストリーミングAPI http://yusuke.homeip.net/twitter4j/ja/javadoc/index.html 作者様に教えて頂いた、ストリーミングAPIを早速試してみよう 実のところドキュメントを読んでも(というか読めないw)あまり使い方がわからなかったりする。そしてぐぐっても…
使えるかどうかもわからないけど、とりあえず環境を本の通り用意 外部に公開するサーバにtomcatを導入するのはローカルで開発終わってからでいいやとりあえずP22までの環境構築完了 ここまではStrutsどころかServletもほとんど知らない初心者にもわかりやす…
タイトルコールのバグ修正 コードをすっきり綺麗に今度こそこれを持ってBOTは完成と思いたい あとはDBに台詞を登録最終的にステップ数は400
publicTimelineを取得するアプリは保留として、携帯で見られるTwitterのページを作ってみよう。 to do 1. webサーバの準備 Apache? 2. アプリケーションサーバの準備 Tomcat? 3. 携帯ページを作る まったく作り方知らない 4. あとはTwitter4jでgetFriendsTim…
タイトルコールしてくれないバグ修正 と思いきや微妙にバグある 対策案考え中 無理やり修正 徐々に汚くなってきた
世間ではJQueryという単語を良く耳にする 使ってみたいので何か入力のあるWebサービスを作りたい問題はサービスを動かすサーバが必要であることと、セキュリティを気にしなければいけないことBOTに実装した自動フォロー返し、自動削除、外人ブロックができる…
ロイドBOTのステップ数えてみたら約800だった カツジもロイドさんとは同じクラスを実行しているだけだから、ステップ数はまったく一緒で800 (違うのは、参照するDBとmainの引数だけ)
Twitterで自分と似たようなPOSTをしているようなユーザーを探すサービスを作ろうと思う。(軽く調べた限り同じサービスはなし?POSTさえ集められればそこまで難しくないはず!(類似度の精度は別として一番の問題は最低1日のPOSTを集めてDBに突っ込むこと ど…
getfrineds()もgetfollowers()も最大1ページ100人しか取得できないみたい Paging page = new Paging(); page.setCount(1000); List <User> friends = twitter.getFriends(page); System.out.println(friends.size()); 100 Pagingクラスでで指定しても1ページで100</user>…
ロイドさんの自動フォローのバグ修正 キリ番のバグ修正 台詞追加
つぶやいたー - ついったーランキング (Twitter Ranking) http://twitty.jp/ranking/status/ロイドさんが23位にランクインしていました。こういう1日の統計をとる機能はどうやって実装しているんだろうIDの取得時間は単純に0:00以降の最初の発言と0:00前の最…
POSTのランダム性能の不具合修正 BOTのPOST回数が少ないメッセージを優先してPOSTする機能追加
BOTがPOST制限にかかっちゃった。 どうやらこれはExceptionとして取得できないらしい ぱっと見は更新できたことになってる1時間ごとにPOSTした回数数えて、制限の125回になったら最初の発言から1時間経つまで休憩するようにしたほうがいいのかな POST制限後…