“According to one measure, Python is potentially on the verge of becoming the most popular computer programming language,” reports ZDNet, joining C and Java as the only other two languages to attain the #1 spot.
Of course, it depends on who’s making t…
DatabricksでCustemer Managed VPCにClusterをプロビジョニングする
ナカヤマです。 DatabricksというSaaSサービスでユーザーの所有するAWSアカウントにあるVPCにClusterをデプロイしてみました。 その流れを記録します。 Databricksとは? Databricks […]
Python+Flask에서 SQLite 사용해 보기
안녕하세요 클래스메소드 김재욱(Kim Jaewook) 입니다. 이번에는 Python+Flask에서 SQLite를 사용해 봤습니다. SQLite란? SQLite는 작고, 빠르고, 자주적이며, 안정성이 […]
make_column_selectorで型・正規表現からカラムのサブセットを選択する
データアナリティクス事業本部の鈴木です。 今回は、sklearn.composeモジュールから、ColumnTransformerで扱うカラムを選択するのに便利なmake_column_selectorを紹介します。 m […]
MAC OS에서 Python+Flask 사용해 보기
안녕하세요 클래스메소드 김재욱(Kim Jaewook) 입니다. 이번에는 MAC OS 환경에서 VS Code를 사용해, Python과 Flask를 설치해 보도록 하겠습니다. VSCode 설치 먼져 V […]
DictVectorizerで辞書のリストを処理する機械学習パイプラインを作る
データアナリティクス事業本部の鈴木です。 今回は、sklearn.feature_extractionモジュールから、辞書のリストをNumPy配列やSciPyのスパース行列に変換するDictVectorizerを紹介しま […]
SecurityGroupに対して自分で許可したIPを複数のAWSアカウント・リージョンから探すためのPythonを書いた
サーモン大好き横山です。 複数の共用AWSアカウントがあり、この度諸事情で離れることになりました。その際ぬくもりのある手作業にて踏み台サーバに対してSecurityGroupでIPを許可していましたので、Ruleを削除し […]…
Bodo.ai secures $14M, aims to make Python better at handling large-scale data
Bodo.ai, a parallel compute platform for data workloads, is developing a compiler to make Python portable and efficient across multiple hardware platforms.
GitHubのOrganization配下のIssue・PRからアサインを外すスクリプトを書きました
サーモン大好き横山です。 とある事情で、「Organizationを抜ける前に、それぞれのリポジトリのアサインをOpen・Closeに関わらず抜けておいてね」という作業を依頼されました。 そこでまず、Issuesで ar […]…
ColumnTransformerで特徴ごとに異なる変換を行うパイプラインを構築する
データアナリティクス事業本部の鈴木です。 前回はscikit-learnのpipelineモジュールで簡単なパイプラインを構築しました。 scikit-learnのpipelineモジュールで機械学習パイプライン […]