2009-06-01から1ヶ月間の記事一覧

LuceneでMoreLikeThisがうまくいかない(いった)

C:\Lucene\files\にTwitterのユーザー名.txtがあり、TwitetrのPOSTが1行に1つ C:\Lucene\indexにindexを作成済み1つのユーザー名.txtから類似したユーザー名.txtを探す import java.io.File; import java.io.IOException; import java.io.Reader; import jav…

Twitter APIについての勘違い

http://twitter.com/statuses/public_timeline.json ↑これとかがTwitter APIだったのかTwitter API Wiki / Twitter REST API Method: statuses public_timeline http://apiwiki.twitter.com/Twitter-REST-API-Method%3A-statuses-public_timelineということ…

Maven2 ローカルリポジトリの追加

mvn install:install-file -Dfile=jarまでの絶対パス -DgroupId= -DartifactId= -Dversion=バージョン -Dpackaging=jar -DgeneratePom=true

BOT更新

非公開にしているユーザーに催促するのを辞めた

Tweetの収集

followメソッドでコツコツ集めてるけど、量的に厳しい firehoseとか使わせてくれないかなー収集した単語はいい感じじゃないかな cnet_jのTweet CNET PC USB キャプチャ CNET 2014年 アイ ムーア 2014年 アイ CNET AD アル ブログ CNET Japan ブログ CNET Jap…

TwitterStreamが落ちてた

エラーログメモり忘れた 自動的に再接続させたい場合はonExceptionメソッドに何か書けばいいのかな 無理矢理mainメソッドを呼ぶとか? 格好悪い・・・ public void onException(Exception ex) { }

Twitterのクローラ

buzztterやふぁぼったーやつぶやいったーの人たちはどうやってTwitterのクローラを開発したんだろう? Stream AIPは最近追加されたものだから使ってないだろうし、かといってgetPublicTimeLine()じゃ漏れがあるだろうし、すぐにAPI制限にかかっちゃいそう。…

辞書

2ch用語を形態素解析したいと考えて2辞Plusの管理人様に用語一覧を頂けないかとメールをしてみた。 貰えたら嬉しいなぁ〜許可を頂けたので2ch用語追加!TwitterからStream API使わせてくれメールの返信が来ない・・・ 放置されたかな?

とりあえずLuceneとSenは置いておいてやること

shadowを動かす shadowで集めるユーザーの基準を決める。投稿数1000くらい? 投稿数が一定を満たしているユーザーを集めるプログラムを作る。 そのユーザーのTweetをユーザーごとにテキストで出力するプログラムを作る。 以上が終わったらLucene動かす。間違…

Twitter4j Streamでエラー

MLに書いてあったやり方(typoなど修正済み)でstreamを試そうとしたらエラーが import twitter4j.Status; import twitter4j.StatusListener; import twitter4j.TwitterException; import twitter4j.TwitterStream; public class TestShadow { public static v…

Lucene + Senを動かしてみる

今日の目標はLucene + Senを動かしてみること Senは単独で動作しているので、とりあえずはLucene単独で動かすことを目指そう。 Luceneのjavadoc org.apache.lucene.index (Lucene 2008-12-20_02-04-42 API) http://hudson.zones.apache.org/hudson/job/Lucen…

My Daily Twittascopeが気持ち悪い

My Daily Twittascopeが気持ち悪いMy Daily TwittascopeとはTwitterのIDとパスワードを登録すると、1日1回占いを自動的にPOSTしてくれるというサービス。 理由 登録すると解除ができない DMを送ると解除してもらえるらしい。があっちがフォローしてくれない…

今度こそLucene+Senを動かす

LuceneのjavadocはDLして解凍したフォルダのlucene-2.4.1/docs/api/index.htmlにある。とりあえずはよさげなサンプル探しだサンプルの通り下記のようにやると、使用すべきではありませんと言われる。 IndexWriter writer = new IndexWriter(index, new Japan…

開発環境

Maven導入してみる Eclipse 3.4.2とm2eclipseでMavenを使ったJavaのライブラリ管理 - public static void main http://d.hatena.ne.jp/Kishi/20090228/1235813480 ここを参考にして導入してみたけど、「依存関係の追加」で失敗する。 commons-langと入力して…

これからやること

タイトルの通り(1度も書いてないことに気がついた 研究 WebOTXの勉強 SIPropの勉強 そもそもSIPの勉強 Twitter関連 自分用に携帯用Twitter作成 携帯用webページについての勉強 類似ユーザー検索サービス Lucene+Sen Seasar2入門(家ではこれ ネット繋がらない…

ストリーミングAPI昨日の続き

import java.io.IOException; import twitter4j.Status; import twitter4j.StatusStream; import twitter4j.Twitter; import twitter4j.TwitterException; import twitter4j.TwitterStream; public class Test2 { public static void main(String[] args) th…

BOT更新

BOT同士リプライしないようにした

ストリーミングAPI

ストリーミングAPI http://yusuke.homeip.net/twitter4j/ja/javadoc/index.html 作者様に教えて頂いた、ストリーミングAPIを早速試してみよう 実のところドキュメントを読んでも(というか読めないw)あまり使い方がわからなかったりする。そしてぐぐっても…

とりあえずSeasar2始めてみる

使えるかどうかもわからないけど、とりあえず環境を本の通り用意 外部に公開するサーバにtomcatを導入するのはローカルで開発終わってからでいいやとりあえずP22までの環境構築完了 ここまではStrutsどころかServletもほとんど知らない初心者にもわかりやす…

BOT更新

タイトルコールのバグ修正 コードをすっきり綺麗に今度こそこれを持ってBOTは完成と思いたい あとはDBに台詞を登録最終的にステップ数は400

携帯でTwitter

publicTimelineを取得するアプリは保留として、携帯で見られるTwitterのページを作ってみよう。 to do 1. webサーバの準備 Apache? 2. アプリケーションサーバの準備 Tomcat? 3. 携帯ページを作る まったく作り方知らない 4. あとはTwitter4jでgetFriendsTim…

BOT更新

タイトルコールしてくれないバグ修正 と思いきや微妙にバグある 対策案考え中 無理やり修正 徐々に汚くなってきた

JQuery

世間ではJQueryという単語を良く耳にする 使ってみたいので何か入力のあるWebサービスを作りたい問題はサービスを動かすサーバが必要であることと、セキュリティを気にしなければいけないことBOTに実装した自動フォロー返し、自動削除、外人ブロックができる…

BOTのステップ

ロイドBOTのステップ数えてみたら約800だった カツジもロイドさんとは同じクラスを実行しているだけだから、ステップ数はまったく一緒で800 (違うのは、参照するDBとmainの引数だけ)

類似発言

Twitterで自分と似たようなPOSTをしているようなユーザーを探すサービスを作ろうと思う。(軽く調べた限り同じサービスはなし?POSTさえ集められればそこまで難しくないはず!(類似度の精度は別として一番の問題は最低1日のPOSTを集めてDBに突っ込むこと ど…

twitter4j

getfrineds()もgetfollowers()も最大1ページ100人しか取得できないみたい Paging page = new Paging(); page.setCount(1000); List <User> friends = twitter.getFriends(page); System.out.println(friends.size()); 100 Pagingクラスでで指定しても1ページで100</user>…

BOT更新

ロイドさんの自動フォローのバグ修正 キリ番のバグ修正 台詞追加

1日の統計

つぶやいたー - ついったーランキング (Twitter Ranking) http://twitty.jp/ranking/status/ロイドさんが23位にランクインしていました。こういう1日の統計をとる機能はどうやって実装しているんだろうIDの取得時間は単純に0:00以降の最初の発言と0:00前の最…

BOT更新

POSTのランダム性能の不具合修正 BOTのPOST回数が少ないメッセージを優先してPOSTする機能追加

Twitter4j POST制限

BOTがPOST制限にかかっちゃった。 どうやらこれはExceptionとして取得できないらしい ぱっと見は更新できたことになってる1時間ごとにPOSTした回数数えて、制限の125回になったら最初の発言から1時間経つまで休憩するようにしたほうがいいのかな POST制限後…