WizardLQ’s | 魔法师の小茶馆

Keep moving, never give up. | 锲而不舍,金石可镂.

有机化学——绪论

概论

引言

目前的宇宙空间中,百分之九十是氢元素,百分之十是氦元素,其余元素合起来占极少的部分。

有机化合物

Carl Shorlemmer:有机化合物就是碳氢化合物及其衍生物

有机化学

李艳梅:有机化学就是研究碳氢化合物及其衍生物的化学

如何学习有机化学

有机化学是偏归纳的学科,而非演绎性的学科

学习建议

  • 从结构和机理角度找规律
  • 多进行比较和归纳
  • 适当量的练习

有机反应的重要动力:结构决定反应的动力

“三个清晰认识”

  1. 对化合物点子分布有清晰的认识
  2. 对化合物反应位点有清晰的认识
  3. 对化合物电子行踪有清晰的认识

学会有机化学看问题的独特视角

对化合物点子分布有清晰的认识

对化合物反应位点有清晰的认识

从结构来预测反应

例如,官能团,官能团所影响的$\alpha$, $\beta$位点。

结构决定反应的动力

对电子行踪有清晰认识

电子的去向:通常从富含电子的位置转移到缺少电子的分子或者位点

画电子转移弯箭头:单电子转移:鱼钩符号;双电子转移:完整箭头。

转移箭头的起点和终点很重要。

电子不能凭空产生,也不能凭空消除

钱包能丢,电子不能丢

机理的角度归类反应(也就是为什么电子能够从一个位置转移到另一个位置)

其他相关知识

(软件)

  • 元素周期表
  • ChemDraw
  • Chem3D
  • SCI-Finder

(知识)

  • 化学家
  • 学科文化

(研究机构)

(刊物)

(著名人物)

(著名企业)

(相关实验)

不仅学习“知识”, 更重要的是学习“智慧”

学到看问题的独特视角,提高学科品位

提高职业素养

电子效应和立体效应

反应机理:正负离子的相遇和结合

有机化学基本知识

目前已知的有机物达到5000多万种,远远超过无机物。

结构上

碳通常以共价键与其他原子相连 covalent bond

自身成键能力强 link to each other easily

同分异构现象普遍存在 iso

物理性质

low melting point

low boiling point

high volatility

often insoluble

density often lower than water

化学性质

稳定性不如有机物 less stable

易燃 inflammation

反应速度慢 low reaction rate

副反应多 frequent side reaction

补充

概念补充

关于$SP^3$杂化

关于自由基

自由基(英語:Free Radical),又称游离,是指化合物的分子在光热等外界条件下,共价键发生均裂而形成的具有不成对电子的原子或团。 在书写时,一般在原子符号或者原子团符号旁边加上一个“·”表示没有成对的电子。

来源:https://zh.wikipedia.org/zh-hans/%E8%87%AA%E7%94%B1%E5%9F%BA

Map Reduce

回顾

很多东西需要阅读获取。

中心的方法维护名字空间,聪明的客户端。

  • 对比,HDFS, GFS
  • 阅读源代码
  • 找工业界是如何根据实际需求来应用

分布式文件系统解决的是存储的问题,这节课解决的是计算的问题。

计算包含哪些功能,

将功能进行并行,就能够实现整体的并行计算

提纲

MapReduce基础

变成模型

分布式框架

算法和Hadoop

背景

处理很多数据

产生很多其他的数据

使用大量的计算资源(例如众核计算)

上面计算需要是简单的

典型的大数据问题(模式)

通常会在一段记录上反复地读写

抽出感兴趣的信息(例如模式匹配)

混洗,排序中间结果

整合汇聚中间结果

输出最终的结果

例如计算积分,搜索图片

大致抽象出来两个过程,这就是Map & Reduce

范式(paradigm)

时刻牢记有多机器并行,而不囿于单机运算

reduce将相同的k2合并

特性

MapReduce是一种编程模型来来处理数据集。

自动并行,自动分布

容错

状态监控

提供了精简的抽象

架构

计算密集

搭建在原来的I/O密集的基础设施上

过程

总体工作结构示意图

Step 1. 将数据文件切分成chunks

Step 2. 分支进程(fork processes)

分配给空闲的works以任务

  • map tasks
  • reduce tasks

Step 3. Map Task

Step 4. 创建中间文件

Step 4.a Partitioning

Step 4.b

Step 5. Recuce Task:sorting

远程通过远程调用

本地直接

所有具有相同的key的被group到一起

若排序,$O(nlog(n))$

否则shuffle输出

Step 6. Recuce Task:

Step 7: 返回给用户

以词频统计为例

  1. 分配程序(程序是一样的,喂的数据不同)
  2. 开谁最闲,分配map任务。能在本地拿到数据就本地处理,否则通分布式文件系统经过网络来获取
  3. map先存在内存中,内存不够写到中间文件中,写R个中间文件。本例子中R不确定
  4. 开始Reduce, 从第一个Reducer开始循环换:将要处理的数据拿过来,拿过来的数据按照partition funtion已经排好了
  5. 排序,按照k2排序,产生文件

分布式框架

一个job包含:

  • 一堆mappper和reducer

让数据和代码尽可能近

自己设计key

自己设计调度机制

  • copy m*r
  • reducer当所有mapper执行完

调度

  • 定制
  • task数量可能超过可用的服务器
  • 处理数据分布不均衡

FIFO 调度

可能短的任务一直等

FAIR

  • 对过个job汇合成一个pool

reduce汇合所有相同的key的数据

作业

提前看实验指导书

实现mapreduce

大数据系统实验FAQ

ssh命令中执行awk出错

ssh远程调用命令一般需要加引号,在引号里面使用awk语句,如果有$符号的话,需要使用\$转义。

.sh文件调用ssh命令报错

在脚本之后加上参数-t

Questions and Answers

stick with 按照继续

in place 适当的

motivation (the reason to learn)

Self-introduction

Framework

  • basic infomation
  • education background
  • experience
  • future plan

Learning language need praticing.

What happen after your interview?

Questions & Problem

What is the problem

What is your problem

What is your question

hard evidence

lose track

write on the fly ??

  • Base on the fact and numbers.
  • Keep your answer short and right to the point

测试

video

Name, vocation, location, address, numbers

关键词

conduct run do performance work

configure

configuration(s) set-up(s) setting(s)

Debate World Cup

Chairman

Positive/Affiemative side

Negtive side

Positive side: High salary job

  • ?
  • Money is important
  • difficult

称述

recruiment 补充

两种不同的场景,一种是高薪酬但是不开森;另一种是低薪酬

Round 1

  1. 临时,钱买快乐

  2. love your

  3. creation

正方

  • growup: 高薪酬===困难,困难===成长 | 简单的事情无法带来进步

反方

  • 低薪!==简单

Round 2

评价

动机:

  • 群面面试
  • 表达赞同和不赞同

关键:

  • 对话,有来有回
  • 不光是表述我赞同还是不赞同xx观点,重要的是给予支撑

辩论会主持人: minutes taker, monitor

opening statement

conclusion(?) statement

salary+other income=income

paying

i am for/agast

  • 分条
    • at the begining, firstly,
    • then, moreover
    • fu..more
    • finally, one more thing, in the end, in summary, in conclusion
  • 举例

video test

trouble shooting

video 2

repoter,

PR department head

scandal

作业

角色扮演。一方老师,一方学生。对话,关于是否接受assignment。

方差分析

方差分析引论

相关术语

  • 定义1:检验多个总体均值是否相等的统计方法,成为方差分析(analysis of variance, ANOVA)。也叫F检验(F test)。
    • 对象:分类型自变量对数值型自变量的影响。
    • 作用:自变量之间有没有关系,关系的强度如何。显著性。
    • 举例1:Head Movement Example: neural talking, expressive movement, random head movement多组实验之间评价,需要用到方差分析。average , one-way ANOVA(F统计量(k-1, n-k),P),说明有显著性差异,但是没有说明哪个好。Post-hoc analysis(tukey HSD)处理说明那个更好。
    • 举例2:treatments measurement

  • 定义2:所要检测的对象称为因素或者因子(factor)
  • 定义3:因素的不同表现称为水平或者处理(treatment)
  • 定义4:每个因子水平下得到的样本数据称为观测值。

基本思想和原理

误差分解

方差分析,虽然感兴趣的是均值,但是在判断均值之间是否有差异要借助方差。通过数据误差来源的分析来判断不同总体之间的均值是否相等。
  • 定义5:组内误差(within groups),来自水平内部的数据误差。组内误差只包含随机误差。
  • 定义6:来自不同水平之间的数据误差成为组建误差(between groups)组间误差既包含随机误差也包含系统误差。
  • 定义7:全部数据误差大小的平方和称为总平方和(sum of squares for total, SST)
  • 定义8:组内误差大小平方和成为组内平方和(sum of suqares for error(within), SSE/SSw)
  • 定义9:组间平方和反映组间误差的平方和(sum of squares for factor A(between), SSA/SSb)

误差分析

  • 比较系统误差和随机误差两类误差(具体通过方差比),以检验均值是否相等。(假设$H_0$:各族总体均值相等)。

单因素方差分析

双因素方差分析

假设条件

  • 独立
  • 正态分布
  • variance

无交互双因素方差分析

有交互双因素方差分析

随机误差平方和的一种计算方法:

还有一种计算方法:

其中#A#B分别代表因素A和因素B的个数。#rep表示重复试验的次数。

Z-, t-, F-统计量

  • 3个以上,F检验
  • 1个,Z,$\mu$已知,$Z=\frac{x_i-\mu}{\sigma /\sqrt{n}}$
  • t统计
    • paried two-sample

合并方差和非合并方差

任务sx和sy相等,合并方差作为总体方差。

比较T统计量和F统计量之间的关系

$F=t^2$

后处理(Post-Hoc Test)

大纲

  • 找出来哪个最好。
  • 找出来一系列的t-test进行检验(两两作比较)。
  • 问题:type-I error inflation。$\alpha$
  • 解决:每次显著性水平控制在一定很小的范围内, or ,将几个组组合在一起比较显著性水平。
    • Bonferroni
    • Tukey Test
    • Scheffe’s Test

Bonferroni

Tukey

Scheffe

Holm and Hochberg

  • 从小到大排序,越小越有可能是显著的。

  • $p1, p2, \dots , pn$

若在p2处停,则表明p1,p2组和其他剩余的组之间有显著性差异。

下集预告

  • 考虑多个因素之间的关系

Read more...